迪士尼在研究一种AI 让声音和画面的剪辑同步

  次阅读 作者:智能小宝 来源:互联网 2016-11-18 10:22 我要评论(0)

从技术的角度来看,擅长讲故事的迪士尼在这方面也有相当多的积累,例如隐藏在上海迪士尼乐园里的那些。现在,迪士尼也要做AI研究,想帮助视频剪辑师更好地工作。

迪士尼旗下的迪士尼研究部门(Disney Research)和苏黎世联邦理工学院合作,正在开发一套机器学习系统,在识别画面的基础上,将画面跟相关的声音连接起来。

这听起来可能有点绕,其实是日常生活常见的现象。例如随着关门的动作进行,人们会“想象”特定的关门声音。本质上,其实是人们把关门相关的视觉信息跟声音信息做了连接。

这项研究想要做的,就是培养机器人这种关联性。在建立画面和声音的强关联性上,最大的障碍是那些跟画面中的物体运动不相关的声音,例如汽车开在马路上,附近还有公放的音乐,这会形成干扰。

他们的培训方式是这样的,给机器人喂入一系列随手拍摄的、带有声音的视频。在喂入前,他们做了前期加工,从视频画面中用软件筛掉那些含有较低杂音,或者纯背景音的画面,再把剩下的画面、声音喂入到系统内,对它进行培训。

在欧洲机器学习大会上,这些研究员展示了初步的研究结果,他们培训的AI系统成功地做了这些画面跟声音的配对:关门、杯子碰撞和汽车在马路上行驶。

暂时还不清楚这个研究会如何帮助迪士尼。在研究报告中,这些研究员称,他们的技术除了有助于帮视频画面跟声音做匹配,可能还有助于对视频资料的分类,或者是运动识别。这些听上去可能是帮助剪辑师在后期剪辑时提高效率。

作为一个支援部门,迪士尼研究部门做的研究看上去跟其它科技公司没有太大差别,但开发的主要目的是为了能应用于迪士尼的旗下业务。

去年,这个研究部门还推出了一项新的眼球追踪技术,几乎可以复制人眼。他们使用了大量摄像头和灯光来捕捉人眼的所有细节,还能保证复制品能根据环境变化而发生改变。

题图来自;维基百科

本站文章信息来源于网络以及网友投稿,本站只负责对文章进行整理、排版、编辑,是出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。如果您有什么意见或建议,请联系QQ28-1688-302!

人工智能实验室
相关文章相关文章
  • Android Wear又难产!然后,开发者不干了

    Android Wear又难产!然后,开发者不干了

  • 疑京东用户12G数据泄露 京东:源于3年前安全漏洞

    疑京东用户12G数据泄露 京东:源于3年前安全漏洞

  • 担忧机器人威胁论?DeepMind教机器人

    担忧机器人威胁论?DeepMind教机器人

  • 华为iLab发布社交VR网络承载研究成果

    华为iLab发布社交VR网络承载研究成果

网友点评网友点评
阅读推荐阅读推荐

科技讯11月28日消息,据英国《独立报》网站报道,如今世界对科技和创新如此关注,是因为人们渴望找到能够解决当前经济、社会和政治问题的解...

上周,科大讯飞、搜狗、百度先后召开发布会,对外公布语音识别准确率均达到「97%」。 而一如阑夕所言「一旦语音识别的准确率达到99%,那将...

想象AI的未来是很有趣的:家庭服务机器人、亚马逊的智能家庭中枢(Echo)等设备将走进每家每户,还有无人机快递和更加精准的医学诊断。这些...

中国AI产业大会12月16日举行:这里有你要的未来,人工智能 中国人工智能学会 机器人 院士 智能机器人 深度学习 AI 报名 ...