来和这个机器人玩玩“石头剪刀布”，享受被支配的快感吧-机器人-人工智能实验室AiLab-中国人工智能网-Powered by AiLab.cn

来和这个机器人玩玩“石头剪刀布”，享受被支配的快感吧

来源：互联网发布日期：2019-07-12 15:03:49 浏览：41273次

导读：新智元报道来源：reddit 编辑：大明【新智元导读】来和机器人玩石头剪刀布，体验被支配的快感！Reddit上一位大神用3层简单RNN训练出一个石头剪刀布大师，你下一把想出什么，它都能猜个差不多。采用3D打印的漂亮外壳，纽扣电池即可供电，不服来战！关注新智...

新智元报道

来源：reddit

编辑：大明

【新智元导读】来和机器人玩“石头剪刀布”，体验被支配的快感！Reddit上一位大神用3层简单RNN训练出一个“石头剪刀布”大师，你下一把想出什么，它都能猜个差不多。采用3D打印的漂亮外壳，纽扣电池即可供电，不服来战！关注新智元和群，了解更多前沿AI资讯！

我们每个人都玩过石头剪刀布，这个简单的游戏，似乎总有人特别擅长。你总觉得自己出什么，都尽在对面的掌握之中。

终于，在你连输N次5局3胜的比试，被弹了一头包之后，你硬着头皮问对面那个满脸得意的人：“哥，你咋怎么厉害呢？”

对面一般会一脸神秘又略带不屑地对你说一句：“你要出啥，我早都预料到了。”

近日Reddit上热议的一个话题就是，如何用机器学习练出一个玩“石头剪刀布”的大师出来。

也许这篇文章的作者小时候也被大神蹂躏过。他利用机器学习训练模型，造出了一台会玩“石头剪刀布”的微型机器人，它的本事就是预测对面下一次出啥。

作者表示，这个机器人在机器学习原理方面并不复杂，模型使用的网络是一个小型的3层vanilla RNN（在TensorFlow/keras中训练），训练数据是两名玩家玩”石头剪子布”的记录数据，将这些数据作为输入，并预测输出对手下一步会出什么。这些记录数据来自roshambo.me上的真人游戏信息。

“我添加了一些周期序列的模拟数据，人们在与AI对战时很可能会尝试的做这些事情。”

如果没有模拟数据（易于预测），模型在测试集上的准确率达到38％（相比之下，完全随机对战的胜率为33%，这么看，其实也没强太多？）。

模型在较大批规模进行训练时遇到了一些问题（无论是填充还是填充和屏蔽渐变）所以最后训练的批规模（batch_size）为1，这对于规模如此之小的网络来说还是可以接受的。

更有趣的部分是，这个网络能够在一个小型微控制器上运行。对网络权重进行量化（以8位整型数据存储）可以节省一些空间，因为使用的微控制器只有2kB RAM和16kB闪存，计算是使用软件浮点数完成的，性能不是真正的问题。微控制器上运行的C语言代码都是定制的，不是特别复杂。

最终的实体设备大约为硬币大小（但更厚一些）。使用定制的PCB板，由CR2032纽扣电池即可供电，并有一个漂亮的3D打印外壳。外形上非常接近我之前定制完成的电子骰子，所以其实工作量不是太大。

参考链接：

Reddit:

https://www.reddit.com/r/MachineLearning/comments/ca88r4/p_a_little_gadget_that_plays_rockpaperscissors/

GitHub:

https://github.com/PaulKlinger/rps-rnn

视频：

https://www.youtube.com/watch?v=iuTKBHW0OaU

相关热词： 机器人石头剪子布机器学习 rnn reddit

来和这个机器人玩玩“石头剪刀布”，享受被支配的快感吧
来源：互联网发布日期：2019-07-12 15:03:49 浏览：41273次

相关内容

AiLab云推荐

最新资讯

本月热点

热门排行

推荐内容

在线客服

热门栏目HotCates

关于我们

版权声明

来和这个机器人玩玩“石头剪刀布”，享受被支配的快感吧 来源：互联网 发布日期：2019-07-12 15:03:49 浏览：41273次