互联网女皇带你看:语音如何重塑人机交互界面?

20160603-0-2.jpg


著名的华尔街证券分析师和投资银行家,被誉为“互联网女皇”的Mary Meeker于北京时间6月2日凌晨的在美国Code大会上发布了2016年度《互联网趋势》报告,作为解读科技行业内部重大发展趋势的科技圣经,其权威性、前瞻性不言而喻。今天我们一起跟随女皇的脚步,探寻语音如何重塑人机交互界面?


语音正成为计算借口,也是计算机输入最有效率的一种形式,及其对语音的识别率从2010年的约70%,提高到2016年的约90%。


人机交互(Human-Computer Interaction, 简写HCI)是指人与计算机之间使用某种对话语言,以一定的交互方式,为完成确定任务的人与计算机之间的信息交换过程。在过去的两百年时间里,人类和计算机的沟通方式不断进化,尤其是在过去的75年中,每隔十年就有新的人机交互方式涌现。从一开始的信息打孔卡、键盘、控制杆,到随后的基于窗口的图形界面,鼠标,以及基于触控和摄像头的移动计算设备,最后到今天的语音计算界面,我们逐步进入了语音交互的时代。


640-2.jpeg


1.  为什么语音会成为人机交互方式的新趋势?


语音已经成为一种最有效的计算输入形式,解放了双手和眼睛,扩展了“永远在线”的概念。


首先得益于语音交互方式对于用户的解放。人打字平均每分钟只能达40个单词 ,而说话平均每分钟可以说150个单词,这种快速的交流方式,可以获得更大的信息量。而且语音操作简单,即时的、随时的彻底解放双手,双眼,在家居,车载环境中最为适用。除此之外,计算机可以根据之前交代的背景信息以及语音内容进行语义分析,理解交互的大环境,实现个性化的定制。


640.jpeg


其次,源于语音界面得天独厚的特点。语音的载体-声波不容易受障碍物遮挡和昼夜变化的影响,这就扩展了我们的交互空间。语音作为自然进化选择的交互手段,其能量消耗也是所有交互手段中最低的。语音界面具有随时访问、分层图形用户界面的特点。而且,语音交互所需的麦克风、扬声器等器件成本更低,更容易小型化。语音交互界面需要自然语言识别及处理技术,自然语言交互是人类最原始、最自然的交互方式。


640-3.jpeg


2. 人机(P2M)语音交互的普及关键点是什么?


人工智能和机器学习领域的国际权威学者,百度首席科学家吴恩达先生曾表示:“假如语音识别准确率从95%上升到99%,所有人都会从现在极少的使用转变为一直使用。大多数人低估了95%与99%之间的区别——99%将会改变游戏”,“没人愿意会一个回复等待10秒。除了准确率之外,延迟是生产语音系统的另一大关键指标”。即语音交互普及的关键点:99%的准确率和无影响的低延迟。


其实,机器语音识别已经基本达到了人类级别,可以实现低噪音环境下的语音搜索。目前在主流平台上的语音识别率都已经超过90%,无论是国外的谷歌、苹果、微软,还是国内的百度、科大讯飞等,语音识别的准确率都在不断攀升。机器语音识别的快速发展,下一个阶段将是提升户外嘈杂背景中,针对不同语音特点的讲话者(如口音、语调等)的语音识别。


3. 人机语音交互发展现状如何?


人机交互界面从键盘进化成麦克风及键盘模式的征途才刚刚开始。目前,受技术进步的推动,移动语音助手使用率快速飙升。接下来,让我们用数据说话看语音搜索的增长速度以及对市场份额的占领。


(1)谷歌的语音搜索较2008年增长35倍以上、较2010年增加7倍以上


640-4.jpeg


Hound语音搜索提供的数据中显示:每位活跃用户在四大类别(Local Information,Fun & Entertainment,Personal Assistant,General Information)100多个领域中平均查询6到8次。而最关心的点就是速度、准确率、与语速匹配能力,以及理解复杂查询能力。


(2)语音正在侵蚀搜索份额


语音搜索在通用搜索中的所占的份额不断上升。


640-5.jpeg


(3)正在搭建的第三方开发者不断涌入助力语音称为人机交互入口


以Amazon为例,亚马逊Alexa语音平台的目标语音设备已经成为家居、汽车和手机的交互入口。


640-6.jpeg


CIRP数据显示,截止至2016年3月,美国已售出约400万台亚马逊Echo设备,其中2016年第一季度出售约100万台。美国亚马逊客户拥有Echo的比例同比由2%上升至约5%。


4. 计算行业的拐点:通常都是后知后觉


2015年iPhone销量或许碰触天花板的时候,亚马逊Echo的销量却开始起飞。一个行业的转变总是缓慢的,又迅速的。


640-7.jpeg


关于语音识别入口之争已经开始,Amazon借势Echo销量攀升上线echosim.io的全新网站,助推Alexa在更多领域提供人工智能语音服务;Facebook F8开发者大会上将其虚拟语音助手Messenger引入聊天机器人,期望通过其强大的社交网络抢占用户群;谷歌I/O开发者大会上发布其年底推出Google Home智能音箱,公开叫板亚马逊;即将召开WWDC大会的苹果也流出要推出Siri音箱的消息......


语音重塑人机交互界面已经开始,语音入口之争,鹿死谁手,拭目以待!



责任编辑:崔岩

声学在线:知识,趣味,圈子

微信平台:公众号搜索“声学在线”

网站平台:soundonline.org

201601251453723698170816.jpg

本文由 常乐发表。转载请注明出处(声学在线)及本页链接。原文链接http://soundonline.org/2016/06/114.html



热文