image.jpeg

语音助理和智能扬声器:为智能家居而战


似乎没有语音助手和智能扬声器的逃脱。一些预测预测市场的增长从2.7 B i n _2018 _t o_2018年9月,18%的美国成年人每月使用一个智能扬声器,预计到2018年底,将近30%的美国成年人可以使用智能扬声器,其中80%的人使用智能扬声器。每月使用该服务。
**
语音助理** 是云服务,它接收来自**智能扬声器**和其他设备的语音命令,_将语音转换为文本,解释结果语言,检测命令的意图,并使用“技能”来确定和执行适当的动作; 通过智能扬声器,或通过家庭中连接到互联网的其他设备的动作。
目前亚马逊Alexa拥有语音助理市场领导地位,Google智能助理迅速赶超,Apple Siri也在不断扩大。虽然每个助手都依赖于发言人,但他们所传达的服务对于公司的商业模式来说是真正的价值。亚马逊支持从他们的商业服务购买,谷歌倾向于访问他们的服务并使用这些数据进行广告,而Apple使用Siri来支持他们的硬件和服务生态系统。
此外,第三方扬声器供应商,例如B&O,Sonos和Harman Kardon,正在使用由三位市场领导者提供的语音助理服务提供他们自己的智能扬声器。
三大语音助理提供商中的每一个都希望通过语音助手连接到由连接设备构成的大型生态系统。其中一些生态系统迅速扩大。亚马逊拥有超过28,000个与超过4,500家不同制造商生产的Alexa合作的智能家居设备,以及超过70,000个Alexa技能。 Google智能助理声称拥有来自1,600个品牌的超过10,000台设备
消费者面临的一个重要问题是他们应该订阅哪个语音助理生态系统。虽然亚马逊Alexa和Google智能助理在基于智能扬声器的语音助手方面处于领先地位,但Apple的Siri在智能手机,平板电脑和计算机上得到广泛应用。

但人们是否使用它们来控制智能家电?

到目前为止,消费者似乎主要使用他们的智能扬声器用于娱乐和信息服务,相关智能扬声器传达的响应。智能家居设备的控制似乎还不是语音助理使用的主要因素
事实上,根据一些调查,使用大型家电的语音助手似乎在下降
虽然使用率可能会放慢,但智能扬声器的采用却没有。这意味着家电制造商现在必须支持所有主要的语音助理,或冒险不考虑其品牌的人。为了简化其设备的使用,一些制造商希望使用内置麦克风和扬声器将它们直接连接到云中的语音助理服务,从而无需使用智能扬声器。然而,根据分析机构组织VoiceBot的说法,这种趋势尚未成熟,尚无大量用途。(1)
然而,elimnate扬声器的设计有其自身的挑战 - 如果家电设计师使用专用的语音芯片用于家用电器,例如亚马逊AlexaGoogle智能助理,那么制造商是否需要为他们想要使用的每个VA使用一个?
当语音助理与消费者设备一起使用时,简单的单动作命令是最受欢迎的。例如,改变联排别墅中的温度,其中几个楼层上的恒温器可以响应单个语音命令,从而使用户上下楼梯。这显然是一种便利。

控制大型电器有何不同?

除了不起眼的恒温器,制造商正在连接厨房的平衡 - 从冰箱到具有互联网连接的系列。然而,我们的非正式调查显示,只有一小部分消费者实际上将他们的可连接设备连接到互联网。更少的人仍然支持语音助手。连接没有直接的消费者价值。控制范围作为烹饪餐的一部分需要比用单一命令设定室温要复杂得多的相互作用。
IBM商业价值研究院明确了消费者想要的内容与制造商认为他们想要的相关体验之间的脱节。他们对制造商的管理人员和消费者进行了一项调查,对数字消费者体验动机进行了排名。
管理人员可能会抽出时间重新考虑他们提供客户真正想要的东西:更多时间,更多便利,更快速的结果和更简单的流程。扬声器 - 或声音命令在哪里适合?如何 - 以及 - 它有什么帮助?

语音助理有一些固有的局限性

在许多方面,语音助手只需用语音命令替换按钮。消费者仍需要考虑行动的背景。当多个设备参与实现诸如烹饪餐食之类的高级目标时,用户必须彼此协调设备动作,以及实现目标所需的其他活动。助手并不聪明,而且告诉扬声器提高烤箱温度是否过分有用是有争议的。考虑这些要点

  • 语音助理使用单个命令。目前,这些主要包括固定短语。实际上,他们按下一个按钮或设置一个拨盘。
  • 随着更灵活的自然语言理解技术的出现,语音命令的解释可能变得模糊不清。由于命令导致行动,误解可能是有风险的。我真的想将烤箱设置为600度吗?我们需要“护栏”吗?
  • 语音助理仅支持单向“对话”。这些设备无法回复,要求澄清意图。建立对云中执行的技能的检查并不能完全解决这个问题。
  • 命令独立于设备的状态。用户必须知道烤箱是否打开,何时应该降低热量等。
  • 语音命令的无状态方面还限制了支持动作序列的能力,如果这些动作取决于设备的状态。在打开炉子上的燃烧器之前,我是否打开了排气装置?
  • 器具通常不能通过说例如洗衣机已完成,或者炉顶上的锅沸腾而发出对话或发出警报。
  • 在许多情况下,只能通过语音助手访问设备功能的一部分。这可能是出于安全原因。只有当有人在厨房时才应打开炉顶燃烧器。或者它可能是因为功能很复杂并且取决于器具的状态,例如将水煮沸,并将面食煮至嫩。
  • 语音助理无法整合上下文数据,例如谁在厨房?冰箱里有牛奶吗?
  • 他们通常不记得历史 - 我们最后一次如何做到这一点?
  • 它们依赖于互联网连接,以及它在每个家庭中可能使其不可靠的障碍。

这些缺点限制了语音助理将其状态从交易提升到真正有用。他们需要语义级别的交互来支持更复杂的活动。语音助理操作无法定制以处理家庭中的特定情况,例如考虑谁是家庭晚餐,或手头有什么成分。缺乏历史会抑制了解消费者偏好的能力。并且它阻止了动作的自动化,使得它们根本不需要语音输入或其他输入 - 使它们更加通用。管理灯光或温度可以通过人的存在完全自动化,没有一个单词说出/听到/听错/误解。

还必须考虑安全性,安全性和隐私性!

隐私方面的考虑越来越成为消费者采用语音助理的障碍。语音数据被传输到云以进行分析,通常无限期地保留在那里,永久存储。
虽然一般情况下,只有在唤醒字发送到云端后发出的语音命令,但一些不幸事件表明存在严重风险。相关软件本质上是复杂的,偶尔会出现故障。然而,即使没有软件故障,语音助理数据,特别是与其他数据结合时,也会产生潜在的严重隐私泄露; 这是对人们家庭生活的非常详细的看法,正如这里所解释的,在这里这里。关于不在社交媒体上播放脏衣服的说法; 然而,语音助手可能更具侵入性。这可能导致使用连接设备的反弹。
目前,我们正处于降低隐私风险之旅的开端。语音助理隐私风险只是关于消费者隐私的大型公众对话的一部分,似乎正在积聚动力。该解决方案的很大一部分必须来自欧洲的GDPR法规等法规。罚款开始被征收,谷歌是第一个也是最大的。但是,也可以采用技术解决方案来降低风险并让消费者更好地控制其数据。最近一项使用区块链技术来保护消费者数据的提案就是一个例子。
还要考虑最后一点。对设备的语音命令通常是“物理”请求……启动设备或打开门。除了隐私之外,这还可能带来严重的安全和安全风险。虽然家庭使用中的潜在损害仅限于家庭,但这些风险是与物联网相关的更广泛风险的一部分。

真正的进步需要整合上下文

随着设备中的计算能力增加并且同时变得更便宜,今天在云中执行的大部分语音助理功能可以内置到设备中。这将提高可靠性和隐私性。它还将为消费者提供更多控制,并支持个性化和定制到特定环境。
为了提供真正的便利性和易用性,我们必须将语音控制与其他传感器输入和外部数据源结合使用。最好通过可访问大量数据的应用程序来实现:设备状态,所有设备功能,环境中的传感器,相关设备和外部数据源。这些应用程序还可以开发和利用个人配置文件和历史记录。保持本地数据可以改善隐私。
然而,真正的进步不是通过简单地将按钮按钮和旋钮转换成语音命令而发生的。我们需要使用人工智能来提高交互的语义级别,重点关注活动的高级目标,而不是单个操作行为。这将焦点从设备转移到使用它们的生活目的。我们需要首先重新思考如何实现目标,例如做饭,保持干净的衣服,节约能源或保持家庭安全。然后,我们可以确定哪种设备可以最好地支持这些目标,以及如何在个性化环境中使用它们。我们看到一些制造商朝着这个方向前进。一个关键的挑战是将语音助理集成到这些更广泛,功能更强大的平台中。
这种焦点的转变将有助于我们实现智能家居的承诺。我们的下一篇博客将探讨如何实现这一目标!


Martin G. Kienzle是IBM Research的电子行业领导者。他的兴趣是物联网(IoT)技术和商业趋势,物联网服务和商业模式。在Twitter上关注他@mg_kienzle,获取智能家居新闻和观点。如果你已经走到这一步,你肯定应该与> 马丁联系查看他> 在5G上的最新> 思想领导力合作参见Martin关于> 混合云使用案例的工作,关于8月份> 人工智能时代的生活关于> 边缘计算,在电子期刊的春季版中结束说明: 1 >> voicebot.ai的语音助手 - 消费者采用 - 报告-2018- voicebot.pdf