展会信息港展会大全

工程师看AlphaGo首落败:为何出现低级错误?
来源:互联网   发布日期:2016-03-14 09:22:39   浏览:15394次  

导读:文/出门问问CTO雷欣 出门问问NLP工程师李理 3月13日消息,人机大战第四局出现大逆转,AlphaGo对形势作出错误判断后,接连出现业余选手也不会犯的低级错误,导致落败。 DeepMind创始人Demis在推特发微博表示,AlphaGo在第79子时犯了错误,但是一直到87子才发...

工程师看AlphaGo首落败:为何出现低级错误?

文/出门问问CTO雷欣 出门问问NLP工程师李理

3月13日消息,人机大战第四局出现大逆转,AlphaGo对形势作出错误判断后,接连出现业余选手也不会犯的低级错误,导致落败。

DeepMind创始人Demis在推特发微博表示,AlphaGo在第79子时犯了错误,但是一直到87子才发现。短短几个子的时间,AlphaGo的胜率从70%陡降至40%以下,发现时为时已晚。

出门问问CTO雷欣称,这其中的原因很可能是由于AlphaGo在复杂情况下的判断还是不够客观,碰到没见过的下法(如今天的白78挖)时会犯错误,而且在犯错误的时候不能够及时发现,会接连出低级错误。对人类来说,如果犯了大错误,应该很快就会发现并且纠正,但是机器的反应都是连续的,不能做出及时调整,这也许是AlphaGo的一个致命弱点。

出门问问NLP工程师李理称,我怀疑是mcts的问题,这个问题导致AlphaGo只区分胜利和失败,但是剩多少和负多少它不区分。李理称,这可能是AlphaGo之前获胜也不多,失败就乱下的原因。

从专业技术的角度看,李理认为,如果一定要猜测,我觉得可能是开局主要靠value network,因为搜索空间太大,有可能在某些特殊的局面下出现非常差的结果。就像之前神经网络识别图片时也出现过很诡异的错误,还有人研究怎么构造让它识别出错的例子。

雷欣称认为,从谷歌的角度来说,这盘棋帮助他们找到了AlphaGo的一个弱点,以后可以更有针对性的去解决这个问题。如果不是李世石这种顶尖棋手,也许很久也发现不了这个弱点,因为水平悬殊太大根本没有机会逼得AlphaGo犯错误。从李世石的角度来看,这也是一个巨大的胜利,证明至少目前人类选手对战人工智能还是有机会的。人工智能虽然计算能力强大,但是还是会犯错误,并且是很低级的错误。这样,人类棋手不会把人工智能神话,以后对战的时候心态会更好。

(本文由科技小羿整理,转载需注明出处)

赞助本站

人工智能实验室

相关热词: 工程师 AlphaGo

AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港