DeepMind公布最强版AlphaGo,训练3天即完胜对战李世石版本

PingWest品玩 / 2018年04月19日 05:14

互联网+

PingWest品玩10月19日报道,谷歌旗下DeepMind团队公布最强版AlphaGo ,代号AlphaGo Zero。经过3天的训练,AlphaGo Zero就以100:0的比分完胜对阵李世石的那版AlphaGo。

此次命名「Zero」是因为它完全不需要依靠人类的纪录数据学习技能,DeepMind仅仅输入围棋的规则,AlphaGo Zero就会开始与自己下棋,每次获胜就会被输入系统,借此学习。

在这样自我学习40天、对战2900万次之后,AlphaGo Zero胜战原版AlphaGo的机率就已经达到90%,这样的能力“能够让AlphaGo Zero成为围棋历史上最强大的玩家。”DeepMind说道。

此外,不依靠人类的经验数据来学习技能,反而能让电脑软件突破人类知识的限制,找出新的游戏策略与技巧,这都让AlphaGo Zero较前一代更强大。返回搜狐,查看更多

责任编辑:

1.环球科技网遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.环球科技网的原创文章,请转载时务必注明文章作者和"来源:环球科技网",不尊重原创的行为环球科技网或将追究责任;3.作者投稿可能会经环球科技网编辑修改或补充。