智能产品

语音识别智能音箱,通信世界·精读-智能音箱大战背后:语音识别技术应用仍存挑战

字号+ 作者:喵大人学猫叫 来源:网络 2018-10-17 23:02 我要评论( )

智能音箱的问世,使得普通家庭进入了语音互动的时代,其使用的简易性甚至超过了智能手机。有业者认为,智能音箱将会取代智能手机,成为家庭自动化或者智能家居生活的入口,

智能音箱的问世,使得普通家庭进入了语音互动的时代,其使用的简易性甚至超过了智能手机。有业者认为,智能音箱将会取代智能手机,成为家庭自动化或者智能家居生活的入口,自然语言对话将成为主流和高效率的用户界面。

智能音箱的问世,使得普通家庭进入了语音互动的时代,其使用的简易性甚至超过了智能手机。有业者认为,智能音箱将会取代智能手机,成为家庭自动化或者智能家居生活的入口,自然语言对话将成为主流和高效率的用户界面。

Strategy Analytics最新研究报告显示,2016年智能音箱全球出货量达到590万台,并将在2022年增长10倍,这是受提升的语音识别精确度、引人入胜的新应用以及多语言支持所推动。不过在智能音箱的竞争中,也面临着诸多挑战,并主要体现在其背后的语音识别技术上。

Echo意外畅销 巨头逐鹿智能音箱

提及智能音箱,在谷歌的Google Home发布之前,亚马逊在2014年率先发布了一款具有语音识别功能的Echo智能音箱产品。需要说明的是,当年业界并不看好这款产品,包括亚马逊自己对该产品的前景也没抱有过多希望。因为亚马逊的初衷很简单,就是希望用户利用Echo更快、更方便地在亚马逊平台购物。但亚马逊采取了在语音识别上更加开放的策略,整合了更多的第三方资源,销量竟是一路攀升。据eMarketer统计,亚马逊的Amazon Echo和Echo Dot今年有望独占美国智能音箱市场70.6%的份额。

尽管亚马逊用Echo在智能音箱领域圈下了足够多的领地,但也不妨碍其他品牌对这一市场的觊觎。先是Google Home音箱在身后紧追不舍,之后传闻称苹果也将在今年的WWDC大会上展示一款搭载Siri语音助手的智能音箱。而现在又有一位“大佬”进入了该领域,即微软在日前举办的Build 2017大会上推出了搭载微软人工智能语音助手 Cortana 的智能音箱 Invoke。

据了解,Invoke是由哈曼·卡顿(Harman/Kardon)公司制造,内置微软Cortana,同时这也是微软Cortana首次拥有自家的专属设备。外观方面,圆柱形的外观设计,有点类似于亚马逊Echo,但微软Invoke提供了黑色以及银色两种方案。不得不说,微软此次与哈曼的合作,也算是一次强强联合。借助微软智能音箱设备,哈曼将自己引以为傲的音质制造技术与微软的语音助手相结合,致力于为用户提供与众不同的语音控制中心。值得注意的是,这款音箱还集成了微软的Skype互联网电话服务,这可能也是微软的杀手锏,毕竟当前无论是Google Home,还是亚马逊Echo都无法支持语音通话。

至于谷歌,在日前结束的谷歌I/O 2017开发者大会上,宣布了Assistant和Google Home的新特性,尽管谷歌花了不到30分钟就讲完了Google Home的新变化,但是Google Home的变化可谓是“飞跃性的”并主要体现在主动提醒、语音通话以及娱乐功能增强3个方面。

可以说,智能音箱在没有主动提醒之前一点儿也不显得智能,因为你要通过说出“Okay Google”来激活它。不过得益于Assistant的更新,Google Home将支持主动推送消息提醒,比如天气、路况以及日程安排等,同时用户也可以自己设定Assistant来推送提醒。

语音识别技术是核心

亚马逊的Echo、谷歌的Google Home、微软的Invoke表面上看是智能音箱,实际上各自背后的语音识别技术才是决定产品体验的关键。目前在语音识别市场的重磅玩家有苹果 的Siri、亚马逊的Alexa、谷歌的Google Now 和微软的 Cortana。

苹果的Siri最早集成在2011年发布的iOS 5系统中,提供有限的天气、信息查询等功能,虽然每一年苹果都会针对自然语音处理性能及功能进行改进,但从数据看,人们使用Siri的频率并不高。而在苹果推出CarPlay车载系统后,Siri的地位被大大加强并逐渐凸显价值,而今年,Siri不仅开始支持第三方应用,还来到了MacOS上。

多年来,Google Now一直承担谷歌语音助手服务的重任,与Siri不同的是,它看上去更像是谷歌搜索的延伸。通过用户定制卡片,可以即时显示用户关心的内容,如新闻、体育比赛、交通、天气等,并且进行一定的上下文联想通知。语音方面,它并不能像Siri那样拟人化地与人聊天,但可以精准地识别问题、提供广泛的搜索答案。显然,谷歌也认为Google Now的语音助手体验并不完整,所以才会推出全新的谷歌助手,广泛植入到更多应用、硬件设备中。

至于微软的Cortana,其最初集成在Windows Phone手机中,可以通过语音命令实现拨打电话、发送短信、做笔记、识别音乐等功能,但由于Windows Phone市场表现越来越差,所以基本上没有用户使用。随后,微软将其植入到Windows 10中,从硬件覆盖上来说无疑更广泛,目前全球至少有3.5亿台电脑运行Windows 10。感觉上,Windows 10版Cortana更像是Siri与Google Now的结合体,一方面它可以通过语音命名实现搜索、应用程序启动等功能,另外还具有一个文本输入框,可以在不方便语音的时候输入文字。

挑战犹存 自然语音交互仍待数年

不管是苹果的Siri、亚马逊的Alexa、谷歌 Now 还是微软的 Corrana,作为语音识别技术,虽然已经有了市场化的产品(例如智能音箱),但其背后的语音识别技术依然面临着共性的挑战。

首先是如何让语音识别技术熟悉不同的语言、口音和方言,这一点在中国市场体现得尤为明显。为了收集中国各地的方言数据,百度在今年春节期间启动一项营销计划,推出了方言对话项目。公司向用户承诺,如果他们为该项目做出贡献,今后便可使用自己的方言与百度展开互动。短短两周内,百度就录制了超过1000小时的方言数据。

谷歌向来信奉“少即是多”的理念,因此该公司开发了一种技术,希望利用不知所云的声音来构建文字和短语。借助公司的语音识别系统,他们希望通过一项改变来解决各种不同的问题。谷歌拼接了数万段时长仅有2~5秒的语音片段。该公司研究员弗朗索瓦兹?比伦法斯(Francoise Beaufays)表示,这一过程所需的计算资源虽少,但却更容易测试和修改。百度也在开发更加高效的算法,只需学习一种语言便可简化另外12种语言的学习难度。在学习只有数万人掌握的语种时,这种技术显得至关重要——因为很难针对这样的语言收集庞大的数据。

其次语音识别技术如何在嘈杂的环境中识别语音指令——包括酒吧和体育场等人声鼎沸的环境。为此,微软在Xbox上部署了一款名为Voice Studio的应用,专门收集人们在玩游戏或看电影时的对话信息。为了吸引用户贡献自己在玩游戏过程中的对话内容,该公司为参与其中的用户提供了各种各样的奖励,包括点卡和游戏道具。该项目在巴西展开了大力推广,当地团队还在Xbox主页上着重推广这款应用。他们随后利用这些数据开发了巴西葡萄牙语版的Cortana语音助理,并于今年早些时候发布。

最后是自然语言理解。许多围绕对话交互界面的突破都要追溯到自然语言处理的概念,这一技术近年来已经获得了足够充分的发展。因为我们不会有意识地以一种结构化的方式来理解语言,所以,用于从大规模的、非标签的数据中进行推理的新数据方法(比如深度学习)看起来非常适用于自然语言理解。这些技术极大提升了计算语言的能力,并且不需要具体对语言的原理进行编码。

尽管如此,自然语言的“难题”离最终的解决依然存有差距。因为不同的应用(问答、情感分析、机器翻译、部分语音标签)需要有不同的模型架构:强监督式记忆神经网络、树形长短记忆网络、双向LSTM限制随机域(CRF)、动态记忆网络等。即使在研究中出现一些非常有潜力的新想法,设计、工程合成、可扩展的对话系统与这些想法的结合依然处于非常复杂的状态,离商用还很远。

所以,当被问及何时才能通过自然语言与数字助理交流,并得到满意的答案时,就连吴恩达这样的顶尖科学家也无法给出确切答案。即便是对最高水平的神经网络学家而言,这项技术仍然有很多谜团尚待解开。有很多工作只能通过不断试错来改进,没有人敢保证某项技术调整可能产生什么样的后果。根据现有的技术和方法,这一过程大约要耗费数年时间。

作者:本刊记者 孙永杰

来源:《通信世界》杂志2017年第14期,总第738期

微信号:CWW-weixin

《通信世界》旗下公众号

最新丨行业丨资讯

关于通信世界

一个全媒体综合服务平台

由工业和信息化部主管,人民邮电出版社主办,

是中国通信产业的前瞻媒体

小百科:物联网时代的到来,让智能生活慢慢变成了现实,智能生活来了,想象我的生活正在被更多智能产品下的场景。如:全覆盖式网络,全屋无网络盲点,保证网络的通畅;客厅儿童房配备摄像头,通过手机电脑实时查看家中情况,保证安全!;人体感应系统,采集人体的多种生活习惯,为你打造最适合最舒适的生活空间。;声控系统,电子设备无需手动操作,接入网络的设备实现声控,免除传操作的繁杂操作。;智能机器人保姆,智能扫地机器人等,这就是智能网络生活来了!

1.本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系删除;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章
  • 智能手环表带贵不贵,厉害了我的“环“,这几款中国造手环,表带都是全金属,上档次

    智能手环表带贵不贵,厉害了我的“环“,这几款中国造手环,表带都是

    2018-10-17 12:48

  • 最好用的智能手环,上半年8款知名智能手环推荐:最高不足千元

    最好用的智能手环,上半年8款知名智能手环推荐:最高不足千元

    2018-10-17 12:48

  • 智能手表测心率准吗?不止有手表10款最佳心率监测设备

    智能手表测心率准吗?不止有手表10款最佳心率监测设备

    2018-10-17 12:47

  • 智能戒指表,智能手表见多了智能戒指却不多见

    智能戒指表,智能手表见多了智能戒指却不多见

    2018-10-17 12:46

精彩导读