突发奇想，如果使用2台alphaGO主机，使用同样的算法和策略，互奕一局，结局如何？

crazypeanut · 发表于 2016-3-10 18:31:07

这个是不是有点自相矛盾的味道？？但是我对结果很感兴趣

爱猫人士薛定谔 · 发表于 2016-3-10 18:42:38

这算是“迭代”吗，昨天也想到这个了
以后办围棋赛，可以分设AI组与人类组，

灭嘎嘎 · 发表于 2016-3-10 18:42:49

胜负五五开吧

yestwp · 发表于 2016-3-10 18:46:55

早已经自我进化3000多万局啦

靠人来比试获取电脑算法经验值的速度太慢

2266998 · 发表于 2016-3-10 18:47:33

不会的，依然是一方赢，并且肯定是一方赢，毫无疑问，

因为每个系统是一个小组，其‘策略’是完全不同的，就是那个‘总策略’的算法与智商水平，决定了谁是赢家，这家伙假如到赌场，肯定被‘劝阻’的，跟山本一个级别，山本就进不了赌场，

这个，就跟我玩自动装配是一个道理，你装配车的路径每个人算法是不同的，最终效率是不同的，

古狗其实就是向全世界宣布，阿拉是‘老大’，以前是IBM是老大，再后来是洛马，

洛马被熊给戏了一次，丢了大面子，但迅速就找回来了，依然用170飞，就是‘挑战与赌气’，哈哈，

跑速度与航程，跑不过诺格，有点‘丢分儿’哈哈，

总体说水平，可能现在还是洛马第一，古狗大概排第二，因为洛马玩这些东西的人，是古狗的好多倍，但也不排除古狗里面有一个‘绝世天才’，跟布劳恩一样的家伙，

就像中国专家希望在‘神农架’里面找的‘非凡者’，哈哈，他们跟俺说这些，俺哈哈大笑，

中米社会条件不同，论侃，米国肯定不是对手，哈哈，

crazypeanut · 发表于 2016-3-10 18:48:23

灭嘎嘎发表于 2016-3-10 18:42
. \3 i2 E0 Q" [: b; z胜负五五开吧

我曾经在一台双路E5 2680 v2的主机上，使用软件对软件下象棋，总计25盘，本来我以为，这个应该遵循p=0.5的0-1分布，但是，结果让人意想不到，红对蓝，红胜22盘

crazypeanut · 发表于 2016-3-10 18:49:40

2266998 发表于 2016-3-10 18:47 # U. _5 [ V. X9 r
不会的，依然是一方赢，并且肯定是一方赢，毫无疑问，
( I$ ?- g$ r. X5 E4 [
$ A4 y2 Q; I/ l+ y; a因为每个系统是一个小组，其‘策略’是完全不同的 ...

我曾经在一台双路E5 2680 v2的主机上，使用软件对软件下象棋，总计25盘，本来我以为，这个应该遵循p=0.5的0-1分布，但是，结果让人意想不到，红对蓝，红胜22盘；看来就像8爷所说的那样，还是一方赢

negtive · 发表于 2016-3-10 19:30:11

马上fps，rts游戏也要没意思了，阿尔法狗下一个目标就是星际争霸。

幸好我已经是剧情党了。

刘景亚 · 发表于 2016-3-10 19:34:25

看了下DeepMind团队发表在Nature上的文章，AlphaGO深度学习、蒙特卡罗树状搜索、自我进化三大招齐出。换句话说，最开始的时候AlphaGO并不会下棋，怎么走完全靠随机蒙，那些蒙对的走法会记忆下来，那些蒙错的走法会淘汰，这就是训练。等下次再对弈时，就会使用上次蒙对的走法。经过上万次甚至甚至上亿次的训练淘汰，水平会不断上升，也就实现了自我进化。
根据这个原理，两个AlphaGO对弈，总会有一个获胜，获胜的新的走法会保留，失败的会淘汰，实现进化。这很像人类的自然进化法则，这也正是AkphaGO厉害的地方。
事实上目前AlphaGO的技能很大程度上都是通过自己左右互搏学习到的。

icegoods · 发表于 2016-3-11 09:43:48

外太空这要这家伙去开疆拓土，进化吧

		自动登录	找回密码
密码			注册会员

突发奇想，如果使用2台alphaGO主机，使用同样的算法和策略，互奕一局，结局如何？

点评

点评

点评

点评

点评

评分