语音助手:人工智能助手如何每天改变我们的生活

通过戴安娜拉莫斯b| 2018年4月16日(2021年7月26日更新)

对我们大多数人来说,最奢侈的事情莫过于有一个助手能随时倾听你的电话,预测你的每一个需求,并在必要时采取行动。现在,多亏了人工智能助手,也就是语音助手,这种奢侈才得以实现。

语音助手的包装比较小,可以在听到唤醒词或命令后执行各种动作。它们可以开灯、回答问题、播放音乐、在线下单等。

不要将语音助手与虚拟助手混淆,后者是远程工作的人,因此可以处理各种任务。相反,语音助手是基于技术的。随着语音助手变得越来越强大,它们在个人和商业领域的效用也将增长。

在本文中,您将了解在消费者和商业环境中利用语音助手技术所需知道的一切。

什么是语音助手?

用一个名字来称呼任何让我们的生活更轻松的技术几乎是不可能的。有各种各样的术语指的是可以为个人执行任务或服务的代理,它们几乎可以互换,但也不完全可以。它们的区别主要取决于我们与技术、应用程序或两者结合的互动方式。

以下是一些基本定义、相似点和不同点:

  • 智能个人助理这是一种可以帮助人们完成基本任务的软件,通常使用自然语言。智能个人助理可以上网搜索用户问题的答案。文本或声音都可以触发动作。

  • 自动个人助理这个词是智能个人助理的同义词。

  • 聪明的助理这个术语通常指的是可以通过智能扬声器提供各种服务的物理设备类型,这些智能扬声器可以收听唤醒词并激活并执行某些任务。亚马逊的Echo、b谷歌的Home和苹果的HomePod都是智能助手。

  • 虚拟数字助理这些是自动化的软件应用程序或平台,帮助用户理解书面或口头形式的自然语言。

  • 聊天机器人文本是获得聊天机器人帮助的主要方式。聊天机器人可以模拟与人类用户的对话。许多公司在客户服务部门使用它们来回答基本问题,并在必要时与真人联系。

  • 语音助理这里的关键是声音。语音助手是一种使用语音识别、语音合成和自然语言处理(NLP),通过特定应用程序提供服务的数字助手。

出于本讨论的目的,术语语音助手将与以下相关术语互换使用:智能个人助理,自动化个人助理,智能助理和虚拟数字助理。

语音助手的使用

我们每天使用的许多设备都使用语音助手。它们存在于我们的智能手机和家中的智能扬声器中。许多移动应用程序和操作系统都使用它们。此外,汽车以及零售、教育、医疗保健和电信环境中的某些技术可以通过语音操作。

语音助手的发展

技术在不断的进步和变化,语音助手市场也会随之进步。2015年4月,该研究公司Gartner预测到2018年底,30%与技术的互动将通过与智能机器的“对话”进行,其中许多是语音。

Tractica是一家专注于人类与技术互动的市场情报公司。他们的报告虚拟数字助理(他们将其定义为帮助人类用户理解书面或口头形式的自然语言的自动化软件应用程序或平台)的独特消费者用户将从2015年的3.9亿多增长到2021年底的18亿。商业领域的用户预计将从2015年的1.55亿增长到2021年的8.43亿。在这样的增长预期下,收入预计将从2015年的16亿美元增长到2021年的158亿美元。

根据Global Market Insights, Inc在美国,从2016年到2024年,该技术的市场份额将以每年近35%的速度增长。除了智能扬声器和手机等设备之外,越来越多的经济部门,如医疗保健和汽车行业,正在寻找语音识别技术的用途。

流行语音助手

2011年10月4日,iPhone 4s上市,苹果公司的Siri成为智能手机上第一个标配的数字虚拟助手。2018年2月HomePod首次亮相时,Siri进入了智能音箱领域。

谷歌Now(后来成为谷歌Assistant)在Android平台上紧随其后。它也适用于苹果的iOS系统,但功能有限。

然后智能音箱出现了,“Alexa”和“Hey谷歌”成为了许多家庭对话的一部分。亚马逊的Alexa是Echo和Dot的一部分。谷歌Assistant是谷歌Home的一部分。

三星也有Bixby。IBM拥有沃森。微软在其Windows 10、Xbox One机器和Windows手机上安装了小娜,而Nuance则安装了尼娜。Facebook曾经有M,但它在Facebook Messenger应用程序中的使用于2018年1月结束。

默认情况下,大多数语音助手都有一些女性的声音,尽管用户可以将其更改为其他声音。许多人把Siri、Alexa和Cortana称为“她”,而不是“它”。

流行的语音助手和功能

开发人员不断为语音助手创造新功能,使其进一步融入我们的生活。在2013年的电影《她》中,一名男子与他的女语音助手关系非常密切,以至于他爱上了她。影评人喜欢这部电影,它获得了许多奖项提名,包括奥斯卡奖和金球奖提名。

什么是智能个人助理?

智能个人助理可以帮助人们完成基本任务。它们通常理解自然语言,可以帮助创建会议请求、报告体育比分和分享天气预报等事情。智能个人助理可以访问设备或在线上的大量信息,这使他们能够执行简单的任务。

智能个人助理的其他术语包括聊天机器人,自动个人助理,或自动虚拟个人助理。

Siri、b谷歌Assistant、Cortana、亚马逊Alexa等都是智能个人助理的例子。

语音助手的历史

语音识别技术早在苹果2011年推出Siri之前就已经存在了。在1962年的西雅图世界博览会上,IBM展示了一个名为Shoebox的工具。它只有鞋盒大小,可以执行数学功能,识别16个口语单词以及0-9的数字。

20世纪70年代,在美国国防部及其国防高级研究计划局(DARPA)的大力支持下,宾夕法尼亚州匹兹堡卡内基梅隆大学的科学家们创造了“哈比”。它可以识别1011个单词,大约是三岁儿童的词汇量。

一旦组织提出了可以识别单词序列的发明,公司就开始为这项技术构建应用程序。神奇世界玩具公司的朱莉娃娃于1987年问世,它能识别孩子的声音并做出反应。

整个20世纪90年代,IBM、苹果等公司都在开发使用语音识别的产品。1993年,苹果公司开始用PlainTalk在其麦金塔电脑中植入语音识别功能。1997年4月,Dragon推出了Dragon natural speaking,这是第一个连续听写产品。ob欧宝娱乐app手机下载它每分钟可以理解大约100个单词,并将其转化为文本。医疗听写设备是最早采用语音识别技术的设备之一。

主流语音助手时间表

科技公司正在努力创造越来越复杂的技术,将我们每天所做的更多流程和任务自动化。甚至Siri、谷歌Assistant和Alexa都可以“学习”新单词和新任务。

人工智能助手如何与人互动?

随着科技的发展,人们与科技互动的方式也在改变。想想互联网搜索变得多么容易。不久前,互联网搜索还必须非常具体,而且往往会产生奇怪和不相关的结果。现在,像谷歌这样的搜索引擎似乎几乎可以读懂你的心思,知道你在找什么。引擎理解上下文和你搜索的意图。

人工智能助手也得到了发展。在早期,文本是与助手应用交互的唯一方式(输入一个短语会触发响应)。现在,声音占据了主导地位。

助理应用程序或智能扬声器总是在倾听他们的唤醒词。默认情况下,“嘿Siri”、“OK谷歌”、“嘿谷歌”和“Alexa”是各自设备上的标准设置,但用户可以在一定程度上个性化他们的唤醒词。“Alexa”可以变成“Echo”、“Amazon”或简单的“computer”。如果家里住着一个叫亚历克斯或亚历克西斯的人,做出这些调整的能力会特别有用。

唤醒词依赖于一种特殊的算法,它总是在监听一个特定的单词或短语,这样手机、智能扬声器或其他东西就可以开始与服务器通信来完成它的工作。唤醒词需要足够长,以便清晰,便于人类说话,并且便于机器识别。这就是为什么你不能随心所欲地改变你的唤醒词。

语音助手并不能真正“理解”你在说什么——他们只是听着你的唤醒词,然后开始与服务器通信来完成任务。NLP是人工智能的一种形式,它帮助技术解释人类语言。

手机上的语音助手

语音助手让我们可以免提完成各种任务,这是许多人喜欢使用语音助手的一个主要原因,尤其是在手机上。苹果有Siri。谷歌手机和大多数安卓手机都有谷歌。三星也有Bixby。Windows手机有Cortana。

皮尤研究中心调查2017年5月的一项调查显示,近一半的美国成年人在智能手机和其他设备上使用语音控制的数字助手。

使用数字语音助手的美国人的百分比

语音助手可以打电话、发短信、上网查东西、指路、打开应用程序、在日历上设定约会,以及启动或完成许多其他任务。

随着手机上独立应用程序的增加,我们的声音可以成为我们生活的一种遥控器。我们可以解锁汽车和房屋,开灯,调节恒温器,更换电视频道,等等。

家庭语音助手:智能音箱的兴起

2011年,当Siri在iphone上首次亮相时,她改变了世界,改变了我们使用手机和其他技术的方式。Siri为手机做了什么,Alexa为家庭做了什么,开启了智能扬声器的崛起。

艾娃Mutchler

《华尔街日报》的副主编艾娃•穆切勒说:“亚马逊花了两三年的时间悄悄地做这件事Voicebot.ai这是一个专门介绍语音技术的网站。灵感来自《星际迷航》(Star Trek)系列中的“电脑”(Computer),一种能听并理解语音指令的电脑。不久之后谷歌赶上来了。消费者对这项技术反应迅速,尤其是价格较低的亚马逊Echo Dot。“只要不到100美元,你就可以尝试一下这项技术,”穆切勒补充道。

美国智能音箱总受众覆盖率

Voicebot智能音箱消费者采用报告2018调查显示,近20%的美国成年人(约4730万)家中有智能音箱。根据调查结果,这一数字预计将迅速上升。

“它的发展速度甚至超过了网络和手机,普及速度也更快。我认为人们对新技术的态度比以前更开放了。对我们来说,跟什么东西说话并不陌生。语音是一种非常方便的交流方式,尤其是在技术方面。穆奇勒说:“在所有年龄组中,这种做法的采用都非常引人注目。此外,智能音箱比智能手机便宜,所以尝试一款智能音箱的投资更少。

在美国有多少成年人使用智能手机

按性别划分的智能音箱用户

智能矛枪的位置

智能音箱使用频率

人们使用智能音箱来实现各种各样的功能。在下面的利用率图表中,你会注意到只有26%的智能音箱用户使用智能音箱进行购买。然而,这些用户中几乎有12%的人每月都会购买商品,所以还有很大的增长空间。

智能音箱用例频率

穆切勒指出:“人们需要习惯使用语音助手来订购东西。”他补充说,使用语音助手订购卫生纸等东西要比订购滑雪靴等东西容易得多。有了语音助手,你就不能看到一只靴子,也不能读到它的描述。你必须盲目地相信推荐,这对很多人来说很难做到。

企业语音助手的使用

尽管智能音箱的家庭市场正在蓬勃发展,但商业世界在采用这项技术方面进展缓慢。但是,它来了。

托尼•卢卡斯

“语音技术仍然是全新的。如果你是早期采用者,你可能感觉不到这一点,但事实确实如此。”Smartsheet产品总监Tony Lucas说道。ob欧宝娱乐app手机下载目前还没有很多商业用途的应用程序,但子公司喜欢交谈。人工智能(由Smartsheet拥有)使非开发人员更容易构建和自动化他们需要的服务。目前的许多应用程序在商业世界中并不实用。“你不会让一群人都坐在电脑前和语音助手交谈。这行不通,也没有道理,”卢卡斯解释道。既然每个人都在电脑前,那么用老式的方式(例如,通过基于文本的搜索)来做一些事情就更有意义了。

但语音助手可能会改变许多地方做生意的方式。卢卡斯举了一个实验室的例子,在那里,为了安全和污染的原因,人们必须戴上厚厚的手套和紧身衣。对他们来说,输入任何东西或按下按钮来让事情发生是不现实的,但语音技术可以通过自动化任务来改变一切。

此外,许多需要自动化的任务并不容易获得。“公司需要培养业务所需的特定技能。它们不是现成的,”卢卡斯强调说。为了降低开发成本,应用程序应该足够通用,以执行各种各样的业务任务。

一些业务系统不允许使用该技术。例如,一些采购部门需要使用发票和采购订单付款,因此这些公司无法利用该技术直接订购智能扬声器流行的东西。

还有一个障碍是语音技术远远领先于法规和要求。与一般消费者不同,企业需要考虑访问授权、归档和记录管理等问题。

在采用这项技术的公司中,许多员工在会议期间使用智能扬声器完成各种任务。如果有人需要知道一个事实或一个地址,语音助手可以搜索这些数据并给出回应。它还可以做笔记,记录行动项目,在日历上设置会议,创建待办事项和后续事项列表,所有这些都可以节省时间并使人们专注于会议。

“这在很大程度上归结为语境切换。如果你有一个对话,去做其他事情,然后试图回来,你失去了一些东西,”卢卡斯说。能够向语音助理询问销售数字或报告,就不需要参加会议的人把注意力从会议上转移到寻找报告上。

此外,如果人工智能助手可以访问公司的数据库,他们可以编译统计数据,自动执行任务,并将听写转化为文本报告。

“我认为,就消费者如何与服务互动而言,语音将成为自网络以来最大的游戏规则改变者。语音助手将把人们从屏幕上带走,”卢卡斯预测道。“这将需要数年时间。我们还在研究这些东西的第一天,这很令人兴奋。很多事情都是首先由消费者驱动的,然后才进入商业世界。”

语音助手的缺点

随着语音助手的接受度和使用量不断增长,一些人对使用它们持保留态度是很自然的。下面,我们讨论一些关于语音助手的主要问题。

为什么人们不买智能音箱
  • 隐私隐私是一个问题,尤其是涉及到智能音箱。在等待唤醒词的同时,智能扬声器一直在倾听。在智能手机上,按下一个按钮或打开一个应用程序就可以激活这个助手。一旦你唤醒它,它就会开始录制你所说的话的音频片段。这些片段代表发送到服务器处理音频并制定响应的文件。真正的大脑并不在我们家里的小扬声器里:它们在其他地方的大型服务器上。说话者发送的信息是通过加密连接发送的。说话者在念唤醒词之前不录任何东西。

    Voicebot.ai的穆切勒说:“人们混淆了‘总是倾听’和‘总是录音’。”“(智能扬声器)的天才之处在于它们可以消除背景噪音,并挑出唤醒词,”她继续说。然后他们才开始录音。

    智能音箱和其他人工智能助手,比如智能手机上的那些,会保存这些录音,并允许用户进入他们的账户并删除它们。

    还有一个问题是,这些录音可能会发生什么。有一种情况引起了人们对隐私的担忧,那就是在刑事调查中使用录音作为可能的证据。早在2016年,阿肯色州一起谋杀案的侦探就在谋杀现场发现了一台与许多智能家居设备相关的亚马逊Echo。警方没收了Echo,并试图通过向亚马逊发出搜查令,获取设备上任何录音记录的信息。亚马逊没有公布这些信息,也不清楚执法部门希望从智能音箱及其文件中得到什么。

    围绕我们的手机和设备信息的法律正在努力跟上不断变化的技术以及我们如何使用它。甚至还有人质疑,智能音箱和其他设备是否应该有一种机制,向当局报告危险词汇、搜索模式或活动。如果有人要求语音助手做非法的事情会发生什么?它能推翻我们的命令吗?随着技术的不断变化,这些问题和其他问题肯定会成为新法律的主题。

    尽管智能音箱的使用在各个年龄段都在增长,但年轻人似乎不像老年人那样有那么多隐私问题。“我认为我们已经习惯了为了方便而侵犯隐私,”穆切勒说。

    卢卡斯指出,20年前,在我们的家中拥有一个永远倾听的扬声器的想法对消费者来说并不是个好兆头。但我们的关注点与以前不同了。他说:“你会接受所有这些东西,因为它们很有帮助。”

  • 精度语音助手并不总能理解我们在问什么。有时候,这是我们说话的方式。其他时候,这仅仅是因为人工智能还没有学会如何做某事。

    一个2017报告咨询公司Stone Temple使用了5000个问题来测试b谷歌Assistant、Cortana、Siri和Alexa的准确性。b谷歌得到了最正确的回答。

    找不到第15页要插入的表。

    还有一个关于答案来源的问题。在在线搜索过程中,用户可以选择结果,注明来源,并单击查看更多信息。当向语音助手提问时,答案通常会作为事实返回,通常不会说明来源。

    人们与语音助手之间的“对话”其实根本不是双向的。要问一个后续问题,你需要再次叫醒助理。此外,真人需要监控人工智能,以便它“学习”新事物。

  • 可攻击性和安全性:尽管语音助手使用加密连接与服务器通信,但仍然存在可攻击性和安全性问题。

    2018年初,亚马逊Echo的一些用户报告说,它会无缘无故地突然发出邪恶的笑声。一开始,人们认为有人入侵了他们的智能音箱。亚马逊调查了这个问题,后来宣布Echo听到了类似于“Alexa笑”的声音,所以它开始笑了起来。作为回应,亚马逊禁用了这种反应,并将Alexa对用户要求它笑的回应改为“当然,我可以笑”,然后是笑。

    由于一些智能扬声器可以识别并响应附近的任何声音,因此客人可以查看或更改您的日历或联系人。此外,一个生气的邻居可以通过对着你的门大喊大叫来设置闹钟,让你早上起床。

    关于这种功能,请注意不要将门锁和安全系统与语音助手连接起来。如果你这样做了,窃贼可能会像你一样轻易地说“打开前门”或“关闭安全摄像头”。

    有人也可能在你不知情的情况下使用你的设备进行购物。为了避免这种可能性,Alexa允许你为语音购买设置一个PIN确认选项。

    对于企业来说,安全问题有点不同。卢卡斯用了下面的例子:在过去,窃贼会闯入首席执行官的办公室,偷走销售数据和收益报告等文件。企业调整了安全程序。后来,公司开始将信息存储在电脑上,因此侵入文件就成了犯罪行为。企业调整了安全程序。现在,小偷可以简单地向语音助手询问关键数据。安全程序需要调整。“我认为你很可能会看到企业解决方案的出现。它们可能基于消费技术,但带有附加组件。”

机器人之战

争夺语音助手市场份额的战斗非常激烈。亚马逊首先推出了Echo,但b谷歌突然出现,并迅速在美国获得了市场份额。

智能音箱市场份额

马奇勒解释说,谷歌在搜索、语言和数据方面都有经验,因此他们有能力迅速进入智能音箱市场。苹果的HomePod落后了,主要是因为功能,iphone上的Siri也是同样的原因。“她对开发者不开放。她非常克制,”穆切勒说。

谷歌Assistant从一开始就会说多种语言,这是Alexa必须学习的。谷歌Home是第一个在美国以外销售的,亚马逊Echo是第一个提供商务服务的。两家公司一直都能理解多种声音,并能区分它们。Siri却没有。

当一家公司推出一项新功能时,其他公司通常也不会落后太多。一开始,智能音箱还不能给手机打电话。现在,他们可以了。如今,所有选项都可以播放音乐、向日历添加项目、执行搜索、发送消息、回答问题、控制一些智能设备等等。“这是一款持续功能的游戏。创建语音助手比人们想象的要困难得多。他们(竞争对手)使彼此变得更好,”穆切勒强调。

智能音箱公司并不靠硬件销售赚钱;关键在于我们未来如何使用智能音箱。关键是让人们尽早接受一个品牌,就像智能手机一样。“一旦你开始使用一个助手,你可能就不会再去尝试另一个了。很难让人们改变,”穆切勒建议道。

构建机器人

如果可用的机器人不能执行您希望它们执行的所有任务,那么可以构建自己的机器人。对于基于文本的机器人,您甚至不需要知道如何编写代码。有一些应用程序可以帮助人们创建可以自动执行任务或事件的助手。

创建一个语音激活的机器人要困难得多。这就是像Converse.AI这样的公司。“我们让非开发人员更容易构建和自动化他们需要的服务。不需要编码经验,”Lucas说。

基于文本的机器人可以自动完成任务并与客户交互。它还可以帮助客户回答问题,访问数据库,帮助客户自助。有关客户自助服务门户(其中许多使用机器人)的更多信息,请阅读“客户服务门户:帮助你的用户自助。”

如果你选择创建一个机器人,确保它能代表你的品牌。此外,要确保它有效,因为如果技术不能帮助客户,它对你的业务就没有任何好处。穆切勒警告说:“危险在于,人们会尝试,但不会奏效,而且他们不会回头。”她提到了三星的Bixby,它在Galaxy S8手机上首次亮相,但在推出时功能并不完善。许多用户尝试了几次,然后要求三星开发一种方法来禁用它,他们在软件更新中做到了。

以下是构建bot时需要考虑的其他元素:

  • 记住终端用户。

  • 选择有用的功能。

  • 赋予它个性。

  • 与各种平台集成。

构建机器人需要时间,所以最好不要着急。专注于把一些事情做得非常好,而不是试图做很多事情(因此,做得不成功)。此外,请记住在必要时更新bot。这不是一个“建好了就离开”的冒险。

语音助手的未来

使用语音助手的人数预计会增加。根据《2018年Voicebot智能音箱消费者采用报告》,近10%没有智能音箱的人计划购买一个。如果这是真的,智能音箱的用户群将增长50%,这意味着美国四分之一的成年人将拥有智能音箱。

期望购买语音助手的消费者

智能音箱在世界其他地区的销售正在扩大,这意味着他们需要“学习”如何“理解”每个国家的语言、口音、方言、俚语和细微差别。中国企业正在开发自己的智能音箱。穆切勒说:“世界其他地区落后于美国,并将很快迎头赶上。”

语音助手一直在改进和“学习”。人工智能公司利用现有系统的数据来改进助手的功能。卢卡斯认为,最终,语音助手可能会变得非常聪明,如果你说你饿了,它会自动点一份披萨。它会根据你之前购买的现有数据得出结论:说你饿了就等于点了一份披萨。

专家们预测,语音助手将在许多其他方面得到改进。正如2017年所描述的那样文章大西洋“人工智能的一个子领域叫做计算创造力,它伪造了可以写音乐、画肖像和讲笑话的算法。”这些功能将帮助智能音箱在没有脚本的情况下“表达情感”和“思考”。解释他们为什么做了他们所做的以及他们下一步要做什么的系统也即将出现。

语音助手不会消失。“我认为人们认为这是一种时尚,但事实并非如此。它正在改变人们在家里做的事情。语音助手将会发展壮大,并将继续存在下去。”“我认为它们(语音助手)将无处不在,智能扬声器可能会在几年内消失,因为电视和冰箱等许多技术都将拥有自己的语音助手。今天的孩子们不会明白,曾经有一个世界,你不能和东西说话,”她总结道。

智能表自动化工作的未来

通过设计一个灵活的平台来满足你的团队的需求,并随着需求的变化而适应,从而使你的员工能够超越自己。

Smartsheet平台可以轻松地从任何地方计划、捕获、管理和报告工作,帮助您的团队更有效地完成更多工作。报告关键指标,并通过汇总报告、仪表板和自动工作流实时了解工作情况,以保持团队的联系和信息。

当团队对要完成的工作有了清晰的认识时,就不知道他们在同样的时间内能完成多少工作。今天就免费试用Smartsheet吧。

了解为什么超过90%的财富100强公司信任Smartsheet来完成工作。

免费试用Smartsheet 获得一个免费的Smartsheet演示