语音识别准确率达97% 我们离对话交互还有多远?

  次阅读 作者:智能小宝 来源:互联网 2016-11-28 13:44 我要评论(0)

上周,科大讯飞、搜狗、百度先后召开发布会,对外公布语音识别准确率均达到「97%」。

而一如阑夕所言「一旦语音识别的准确率达到99%,那将直接进入产业爆发的黎明」,在从97%迈进到99%的路程中,各大巨头和资本早已开始造势布局。

97%的准确率意味着优秀产品落地?

97%这一数字,看似散发着胜利的曙光,却仅仅是语音识别准确率而已。

大众预期的产品里面,智能语音作为人机交互层,需要达到完全理解的程度。这不仅需要高准确度的语音识别,更需要复杂动态的语义理解,机器才能准确理解用户意图。但这是两种不同的技术:语音识别仅仅将用户的语音指令与嘈杂背景音剥离开来,保证原始命令无误;而语义理解更为复杂,也是提升用户体验的关键步骤要支持在不同用户场景下,理解用户的指令,理解真正用户需求,进行上下文管理,并有效完成一次对话。

拿简单的点外卖做个比方。智能手机上点外卖方式,无非是打开app,用户自主选择、点触。而以语音交互为入口,用户会向智能终端说道:「饿了,有什么好吃的?」

「您想吃点什么?」

而用户会继续语音发布指令:「我想吃火锅,超级辣的那种。」

哪怕siri级别的助理,也足以搜索出足够多的推荐,并且语音回复:「附近的火锅有xxx,xxx」

「恩,但好像一人份的海底捞好像太多了,还是换冒菜吧。」

对话如此循环往复,机器接受语音命令,替用户筛选出有效信息,降低了用户交互成本。而现有的智能助理到这里往往会犯懵,在用户切换话题的时候回答不知所云。而这也是智能助理广为诟病的主要缺陷,即缺乏对话管理能力,导致用户体验不佳。而这一部分的提升主要依靠自然语言理解和深度学习技术的进步。

而获取不同用户场景下的海量数据进行训练,才能让机器满足复杂的场景需求。而这也是开发布会的三大团队步调一致的方向。根据科大讯飞发布会来看,业务从To B转向To C,智能硬件将是下一个突破点,产品包括智能电视、音箱等。而这些产品的背后都是同一个技术平台AIUI作为核心技术平台驱动。如果说智能硬件是科大在C端尝试开辟的入口,搜狗和百度依然是从输入法中获取用户数据。搜狗自有搜索引擎作为数据来源,而百度还有百度地图等其他产品辅助。

本站文章信息来源于网络以及网友投稿,本站只负责对文章进行整理、排版、编辑,是出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。如果您有什么意见或建议,请联系QQ28-1688-302!

人工智能实验室
相关文章相关文章
  • 全球首款AI性爱机器人要开卖:自主学习新姿势

    全球首款AI性爱机器人要开卖:自主学习新姿势

  • 智能助理作用有限 人机合作效果更好

    智能助理作用有限 人机合作效果更好

  • 无人机频"闯"机场 "黑飞"威胁航空安全该如何管?

    无人机频"闯"机场 "黑飞"威胁航空安全该如何管?

  • 穿上这3吨重的机甲机器人 我能跳过一辆车

    穿上这3吨重的机甲机器人 我能跳过一辆车

网友点评网友点评
阅读推荐阅读推荐

近日,国家发改委公布大数据国家工程实验室名单,由阿里云参与的工业大数据应用技术国家工程实验室和大数据系统软件国家工程实验室均获批复...

智能菌(公众号:Smartman163)为媒体智能工作室旗下专注人工智能热点话题和产品的栏目,未来已来,还不上路? 本文为智能菌第10期:《中国...

人类已经不满于让人工智能和人类对决了。 就在昨天虐狗节,36氪发布了一篇关于Google的Deepmind团队如何让两个人工智能在一起玩游戏的文章...

这款机器人来自Alphabet(Google)旗下的机器人公司波士顿动力(Boston Dynamics)。他们昨天在Youtube视频网站上公布了新的视频,推出了研...