中美企业在智能语音商业化道路上有何不同?

0 (17).jpg


亚马逊首席技术官WernerVogels在2017年Invent主题演讲中指出:“到目前为止,我们一直受到计算机交互技术的限制,我们现在只能通过键盘往Google中输入一些关键字来得到信息,键盘键入的输入方式是如今我们唯一的输入方式。而未来的数字系统的接口将不再是机器驱动的,我们将以数字系统为基础来建立起更人性化的自然界面,这将会使整个环境都变得活跃起来。”


智能语音交互技术将成为未来的趋势。在Amazon Echo,小米AI,天猫精灵等智能语音设备越来越流行的趋势下,人们慢慢开始习惯使用声音来与电脑进行交互。这样的现象开始慢慢的进入消费级领域,而全面的商业化也将只是时间问题。


0 (13).jpg


未来语音识别是人机交互里很重要的模块,从PC时代到现在的移动互联时代,人机交互由鼠标键盘走向智能手机、Pad等的多点触摸。到了智能硬件时代,交互则更加多元,不仅有触摸,还有基于语音、视觉的交互。原本是以机器为中心的人机交互,逐渐走向以人为中心的自然交互。在将来万物互联的浪潮下,以语音为主,键盘、触摸、视觉、手势为辅的交互时代很快会到来。然而在不同的市场环境下,智能语音交互技术商业化存在者极大的差异性。

 

美国市场:语音交互巨头把控智能语音服务,推动商业化进程


在美国市场中,智能语音巨头拥有着完善的智能语音服务和语音平台,如智能语音巨头亚马逊:Alexa平台技能已突破25000。智能语音巨头在利用他们开发出的软件技能,结合旗下echo系列的硬件产品,进行着智能语音技术的商业化。同时智能语音巨头为开发者和创业提供相应的语音服务,并帮助其构建语音界面,从而扩展智能语音在其他领域商业化的进程。


如:亚马逊将Alexa for business作为云服务引入到Invent中提供语音服务,此举吸引大量创业公司及独立开发者去使用语音服务,并附加到公司产品中。Alexa for business引入到工作场合,在个人和共享 Echo 设备上帮助各种类型的工作人员变得更有效率和更有条理。同时Alexa for business应用到一些办公应用程序中,帮助其安排会议、管理待办事项清单和设置提醒。如Synqq今年推出一款便笺应用程序,该程序使用语音和自然语言处理日历事项和注释,并添加到他们的应用程序中,整个过程无需打字输入。


0 (14).jpg

Synqq应用宣传图


而美国另一大智能语音巨头苹果也开始逐步开放Siri在应用程序上的使用,现在Skype,微信,SquareCash,健康训练等手机应用程序开始接入Siri。在未来发展中,苹果商店中有超过两百万的应用,其中一大部分明显能够适用智能语音Siri的输入方式,比如邮件、浏览器以及生产力工具应用,这些应用都需要语音输入来减少用户劳动量和增进使用交互。


同时苹果拥有着极为庞大的用户群体和开发者群体,这将是苹果智能语音商业化的坚实基础。Siri与应用程序的结合将大大拓展智能语音在手机及其他设备上商业化的可能性。


在智能语音巨头的帮助下,键盘的作用慢慢开始消退,语音开始提供一种更自然的与计算机交互的方式,并取代键入的需要。同时智能语音技术在巨头的控制下进行着快速的商业化。

 

 中国市场: 百家争鸣推动智能语音垂直领域应用


相比较于美国市场,中国在智能语音领域上具有诸多优势,有望实现智能语音技术商业化在国际上的超越。中国市场潜力大,人口密度大,需求各异决定了个性化服务需求较大。同时在数据业务场景方面,中国本身有一些先天优势,中国地大物博,人口众多,不管做物体识别还是场景识别,科技企业都可以在各个场景当中获得一线数据;其次在场景应用实践上面,中国具备所有智能语音的应用场景,而且大环境勇于接纳新技术新东西。


在大环境优势的推动下衍生除了一批具有极大潜力的智能语音创业公司,如声智科技,云知声,其中仅涉及语音技术的公司就有超过20多家。根据亿欧智库整理的数据表明,中国智能语音项目融资书销量在2014年后明显增多,为同期的3.7倍,并在之后的几年力保持不逊色的融资情况。


0 (11).jpg

图为语音领域AI创业公司获得投资情况


智能语音在垂直领域的应用也正在被这些公司积极的推动着,在中国市场中垂直领域的应用前景更加广阔。以“智能语音操作系统”为核心的人机交互,其背后所连接的智能家居、物联网和安防、身份识别场景,正逐渐成为AI商业化落地的主战场。实现智能音箱等领域的垂直应用,智能语音交互初创企业也正在尝试更多的应用可能。


智能语音企业目前聚焦在智能家居、车载物联网、机器人等领域,通过赋能传统科技企业,实现产业升级。如云知声正将注意力集中到医疗垂直领域。如云知声与包括北京协和医院在内的全国近百家医院合作建设“医疗智能语音录入系统”,并与云知声与平安好医生合作,成立上海澔医智能科技有限公司。

 

共同契机:智能语音交互消费级服务的发展


在美国亚马逊Echo已累计销售近千万台,苹果、谷歌陆续发布旗下智能音箱,而在中国小米AI智能音箱与天猫精灵也广受用户好评。中美市场中,智能音箱已经成为语音交互技术在消费级服务市场中的重要载体,其销量也证明了智能语音交互技术在消费级市场中的巨大潜力。


另外一方面苹果,微软,阿里巴巴,讯飞等公司运用其语音助手在移动设备端延伸出的实时语音翻译、语音输入法、语音控制等语音应用,智能语音技术供应商正在挖掘众多应用领域,加速消费级服务。


0 (15).jpg

亚马逊Echo产品图


在其他消费级智能产品应用方面,多家智能语音技术供应商在电视、冰箱、智能穿戴和车载等多个场景下与多家公司展开开合作。另外,奔驰、宝马、丰田等国际厂商、国内汽车厂商也和多家智能语音厂商实现合作,在汽车电子智能化的技术研发、产品设计、以及整车应用领域全面深度合作,共同研发智能汽车。


在中国消费级服务市场中,语音产业在2017年发展的如火如荼。语音市场行业规模日渐扩大至60亿元,2017同比增速超过60%,市场规模达到100亿元。而且根据ABI Research在2016年发布的预测报告中,估计到2022年,支持语音控制的装置出货量将达到7500万台,其中智能喇叭/数位语音助理预计将达到4700万台,预计智能音箱销售量将仍会逐步上升,未来三年内还将保持50%以上的复合增速。


0 (16).jpg

图为2017年中国智能语音产业规模与增长


智能语音商业化的未来:技术与产品的结合


在语音交互技术逐步商业化的情况下,语音识别不是一个单独的技术,其需要同其他技术进行融合,比如机器同传、语音交互,未来的产品将会是技术与技术的组合,产品与产品的组合。


如何做出一款好的语音交互产品,首先是要重视场景和知识。只有技术(ASR、NLU等)与具体应用场景比如车载、智能家具、可穿设备结合在一起,才能得到稳定的产品。另外,仅仅有技术是不够的,还需要技术创新。在得到良好的使用体验之后用户基数会扩大,带来更多数据,这些累积的数据也是推动技术提升的关键。


只有有了产品的迭代、有了真实的数据才能更好的分析出用户需求,更好的推动产品发展。语音交互以技术为驱动,加之好的运算力带来大量数据,以此进行迭代,不断通过技术和产品的耦合得到更好的产品。然而最终的目的是给用户带来更好的交互体验。


本文由 袁媛发表。转载请注明出处(声学在线)及本页链接。原文链接http://soundonline.org/2018/01/250.html



热文