吴恩达:百度语音技术有潜力彻底改变人机交互

  次阅读 作者:智能小宝 来源:互联网 2016-11-24 08:55 我要评论(0)

科技讯11月22日,百度宣布在其语音开放平台上线三周年之际,向公众开放四项全新语音技术的接口,以使用户在使用语音与机器进行交流时,享受到更奇妙的交互体验。

百度公司首席科学家吴恩达在演讲中对百度最新的语音技术进展表示满意,他简单介绍了这四项深具革命性的语音技术,即情感合成、远场方案、唤醒二期技术和长语音方案,并宣布即日起百度将这几项技术免费开放给用户和开发者共享。

这些技术旨在解决用户在使用语音交互的场合时,普遍感到困扰的一些关键问题。例如,百度情感合成技术主要聚焦在为合成语音“加入情感”,目前可达到接近真人发声效果,百度今年早些时候曾利用此技术,复原已逝明星张国荣的声音。

类似地,开发者还可以利用新的接口,使语音识别距离增加到3-5米,将设备的语音唤醒率提升到95%以上同时更省电误报更少,或提升长时间语音识别的准确率问题。这将为语音技术带来远比现在更多的想象空间,而不只是遥控电视或解锁手机。

例如,前两者的代表是百度的“小度机器人人机语音交互点餐”,已在上海肯德基旗舰店投入应用,可远距离随时应答点餐。后者则已经在诸多内容记录、智能客服、视频转写等应用场景表现出巨大的想象空间。

在这场名为“极智开放·共语未来”的庆典上,来自斯坦福大学的人工智能专家James Landay,也分享了一项与百度合作的最新研究成果,该研究发现智能手机在语音输入时,输入速度比键盘输入快3倍。他表示,“近两年,受益于大数据和深度学习技术的不断发展,语音识别技术突飞猛进,速度及准确性都有了长足进步。”

吴桂林打开视频应用“爱奇艺”的手机客户端,说“VIP续费”,系统准确跳转到了相应的充值页。这位爱奇艺技术总监指出,借助百度语音开放平台,每天有百万以上的爱奇艺用户使用语音搜索,其中80%以上转化为有效点击。

读者甘肃数码科技有限公司总经理金大时认为,语音开放平台的价值并不止于商业。“读者数字农家书屋”已在甘肃庆阳市试点成功,完成了65个新农村“数字农家书屋”。他表示,“很多不识字的老年人和留守儿童,语音合成让他们也享受到了阅读的乐趣。”

目前,百度语音开放平台的合作伙伴已涵盖多个领域和场景,包括智能手机领域的联想、中兴;智能家居领域的长虹智能电视、康佳智能电视、SONY智能电视;汽车行业的特斯拉、途胜;智能设备领域的惠普、艾米通讯;智能服务领域的携程、手机QQ阅读等。

本站文章信息来源于网络以及网友投稿,本站只负责对文章进行整理、排版、编辑,是出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。如果您有什么意见或建议,请联系QQ28-1688-302!

人工智能实验室
相关文章相关文章
  • 微信朋友圈能发“大视频”了:最长10秒 可编辑

    微信朋友圈能发“大视频”了:最长10秒 可编辑

  • 软机器人出现 帮瘫痪者重新站起

    软机器人出现 帮瘫痪者重新站起

  • IBM全力押注区块链:推出应用开发生态系统

    IBM全力押注区块链:推出应用开发生态系统

  • 谷歌的神经翻译系统意味着机器翻译到尽头了?

    谷歌的神经翻译系统意味着机器翻译到尽头了?

网友点评网友点评
阅读推荐阅读推荐

科技讯11月28日消息,据英国《独立报》网站报道,如今世界对科技和创新如此关注,是因为人们渴望找到能够解决当前经济、社会和政治问题的解...

上周,科大讯飞、搜狗、百度先后召开发布会,对外公布语音识别准确率均达到「97%」。 而一如阑夕所言「一旦语音识别的准确率达到99%,那将...

想象AI的未来是很有趣的:家庭服务机器人、亚马逊的智能家庭中枢(Echo)等设备将走进每家每户,还有无人机快递和更加精准的医学诊断。这些...

中国AI产业大会12月16日举行:这里有你要的未来,人工智能 中国人工智能学会 机器人 院士 智能机器人 深度学习 AI 报名 ...