PingWest品玩10月19日报道,谷歌旗下DeepMind团队公布最强版AlphaGo ,代号AlphaGo Zero。经过3天的训练,AlphaGo Zero就以100:0的比分完胜对阵李世石的那版AlphaGo。
此次命名「Zero」是因为它完全不需要依靠人类的纪录数据学习技能,DeepMind仅仅输入围棋的规则,AlphaGo Zero就会开始与自己下棋,每次获胜就会被输入系统,借此学习。
在这样自我学习40天、对战2900万次之后,AlphaGo Zero胜战原版AlphaGo的机率就已经达到90%,这样的能力“能够让AlphaGo Zero成为围棋历史上最强大的玩家。”DeepMind说道。
此外,不依靠人类的经验数据来学习技能,反而能让电脑软件突破人类知识的限制,找出新的游戏策略与技巧,这都让AlphaGo Zero较前一代更强大。返回搜狐,查看更多
责任编辑: