设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
LUPA开源社区 首页 IT综合资讯 查看内容

高级搜索树+深度增强学习,Google DeepMind AI算法击败欧洲围棋冠军 ...

2016-1-28 23:30| 发布者: joejoe0332| 查看: 2592| 评论: 0|原作者: CSDN|来自: CSDN

摘要: 纵横十九道,棋子无大小,平均150回合的比赛,最大有3^361 种局面(大致为10^170),围棋一直被视为人工智能(AI)的最大挑战之一,但Google旗下的DeepMind声称其AI算法已经掌握了比赛。 ...

纵横十九道,棋子无大小,平均150回合的比赛,最大有3^361 种局面(大致为10^170),围棋一直被视为人工智能(AI)的最大挑战之一,但Google旗下的DeepMind声称其AI算法已经掌握了比赛。

图片描述

据Nature报道,DeepMind宣布其程序AlphaGo击败了欧洲围棋冠军樊麾,五战五胜,没有任何让子。

图片描述

DeepMind引以为傲的是AlphaGo并非基于规则的程序,而是以机器学习算法取胜。据其解释,AlphaGo将高级搜索树与深度神经网络结合在一起。这些神经网络通过12个处理层传递对棋盘的描述,处理层则包含数百万个类似于神经的连接点。

AlphaGo包括两种神经网络来判断每种下子策略的优劣,其中“策略网络”(policy network)负责选择下一步走法,抛弃明显的“臭棋”减少搜索的宽度,重点分析好棋,“价值网络”(“value network)用来计算局面,抛弃某些路线。

图片描述

DeepMind用人类围棋高手的3000万步围棋走法训练神经网络,同时,AlphaGo还通过增强学习(Reinforcement Learning)自行研究新战略,利用50台机器,在它的神经网络之间运行了数千局围棋,反复试验调整连接点。

在和其他围棋程序的对抗中,AlphaGo的胜率为99.8%(495局中只输一局)。2016年3月,AlphaGo还将在韩国首尔公开对决韩国围棋选手李世石九段。李世石是近10年来获得世界第一头衔最多的棋手,但DeepMind联合创始人Demis Hassabis表示对AlphaGo很有信心(We’re pretty confident)。届时,我们可以一睹最牛围棋AI的极限。

Nature报道:Google AI algorithm masters ancient game of Go


酷毙

雷人

鲜花

鸡蛋

漂亮
  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部