网站公告:大连围棋网微信公众号大连围棋 服务热线:0411-81981206 大连围棋网 分享到:

围棋天地

当前位置:首页 - 围棋天地

超级围棋AI ELF OpenGo全面开源!FAIR田渊栋揭秘训练过程

发布时间:2019-02-15点击量:0
超级围棋AI ELF OpenGo全面开源!FAIR田渊栋揭秘训练过程

ELF OpenGo 发布之后,不少围棋爱好者们对其进行测试,发现这是一款级为先进的人工智能陪练助手。事实上,这款开源机器人在与人类选手的对弈当为取得了耀眼的成绩——包括与顶级职业围棋选手下出了 20 比 0 的胜绩——且开始被人工智能研究社区所广泛采用,用以运行他们自己的围棋实验或重现其他人的研究成果。ELF OpenGo 在 AI 围棋锦标赛当中还同众多与之同源的修改版 AI 机器人进行了对抗。目前,ELF OpenGo 已经成为美国围棋协会的一员,以混双的形式协同人类选手共同对抗其他人机组合围棋队伍。

Facebook AI Research (简称 FAIR) 团队日前公布了与 ELF OpenGo 相关的最新功能与研究成果,包括从零开始重新练习而成的更新模型。此外,我们还发布了这款机器人的 Windows 平台可执行版本,旨在帮助围棋选手们更轻松地利用这套系统作为训练辅助工具;另外,我们还公开了 ELF OpenGo 在 87000 场专业围棋对弈当中的归档分析信息。

现在,选手们可以查看我们的系统如何对早自十八世纪的顶尖职业选手棋谱进行理解,详尽评估他们的表现,并深刻解析特定棋局当中的具体棋步。我们很高兴地看到这套多功能平台能够帮助研究人员们更好地理解 AI 技术,也很高兴看到围棋社区的选手们乐于利用它磨练自己的技能并深入钻研这门古老技艺中的全新天地。

韩国围棋协会公关副总监 Beomgeun Cho 表示,“我可以肯定地讲,ELF OpenGo 项目给韩国围棋社区带来了巨大的影响。自从其问世以来,几乎所有高水平韩国职业棋手都开始一身是胆和 ELF Go 程序分析自己与其他选手间的对弈。也正因为如此,该项目的出现不仅提高了韩国围棋的水平,更是将全球围棋技艺推向新的高点。”

打造一款服务于每个人的强大 AI 机器人

当 DeepMind 在 2017 年发布其 AlphaGo Zero 围棋机器人的出色表现时,可以看到这一以深度强化学习(简称 RL)为核心的试验性研究成果确实为拥有四千年历史的围棋运动注入了新的生命力。考虑到围棋当中固有的高分枝数量、复杂的交互机制以及精妙的模式设计等因素,行之有效的围棋机器人必须有能力推导出各类非直观且极为缜密的结论,并借此探索并发现新的行棋策略。围棋带来了一种包含数百万种潜在移动组合的环境,且其中没有任何隐性或者与偶然性相关的游戏机制(这一点与打骰或扑克游戏完全不同)。然而,虽然 AlphaGo Zero 及其继承者 AlphaZero 确实证明了人工智能系统有能力在训练之后击败一切人类选手,但它们更像是深度 RL 的一种理想范例,而非能够切实服务于广泛 AI 研究社区的普遍性工具。

作为我们开放科学宗旨的重要组成部分,我们于去年发布了 AlphaZero 的重新实现方案,旨在帮助更多研究实验室得以更深入地理解这些方法的工作原理。我们对其模型进行的开源也为未来的研究工作提供了必要的基准。我们意识到,由于需要大量计算资源作为支撑,即使是拥有同样的开源代码,大多数研究人员仍然无法重现我们的结果。正因为如此,我们决定在新论文当中从零开始重新训练 ELF OpenGo。这项工作证明了为什么 AI 在对阵人类选手时能够表现出如此强大的棋力,亦阐述了现有技术的局限性,从而帮助研究人员更好地理解其中的潜在机制并将其应用于更多其它场景。

对于整个研究界来说,我们新近更新的模型与代码代表着 ELF OpenGo 的最佳版本。此次发布囊括我们的 2000 万份自我对弈记录以及 1500 套用于生成这些记录的中间模型数据集,同时亦进一步降低了对于计算资源的需求量(自我对弈是训练过程当中硬件资源占用量最大的部分)。对于希望深入研究基于 RL 的围棋机器人如何学习技巧并掌握诀窍的研究人员,推荐大家参阅我们的论文——其中详细介绍了大量消融研究结果,并在评估过程当中不断修改各项特征以更好地理解算法的具体特性。

网站首页 |围棋资讯 |围棋课程 |学习园地 |围棋常识 |围棋天地 |围棋资料 |围棋图库 |在线留言 |联系我们
地址:大连市甘井子区华北路872号 电话:0411-81981206 手机:17741195719
版权所有:大连围棋网 技术支持:大连才思
大连围棋网