雷锋网 AI 科技评论按:作为围棋界检验 AI 程度的 human benchmark,柯洁再次落败。
2018 年 1 月 17 日晚八点半,在腾讯野狐围棋平台的1059号对弈房,迅速聚集了 7000多名围观棋友。如此火爆,只因这里正发作着一场围棋史上极为稀有的对弈——作为国际围棋界职业顶尖棋手,而且是最顶尖的那个,柯洁初次在地下对战中成为被让子的一方,而且是让二子(黑帖 6 目半)。
与柯洁对弈的是腾讯 AI Lab 研发的围棋 AI 「绝艺」(绝艺指点 A)。但是很快,虽然被让二子,柯洁仍在第 77 手或许是对本人的表现太过不满而直接认输。这场意义严重的对决,就这样猝然终结。
随后,超级银冠棋手剑过无声(连笑九段)退场应战「绝艺」,但苦战 247 手后依然无法认输。
“绝艺”对弈柯洁九段(即“埋伏”)和连笑九段(即“剑过无声”)。对弈中,柯洁追杀白棋右上未果,仅弈77手,便直爽认输;一个小时后连笑九段跟进,鏖战247手后中盘告负
围棋界的人士能够对「绝艺」的大名曾经耳熟能详了;而非围棋界的人士,能够还不是很理解此「国产狗」。
相比于日本的 DeepZenGo 和英国的 AlphaGo,国际在 Computer Go(电脑围棋)的投入起步较晚。腾讯公司从 2016 年 2 月才开端着手研制围棋 AI。但很快,「绝艺」人工智能的第一个版本便于 2016 年 3 月 4 日完成了。
随后,「绝艺 AI」在腾讯围棋的野狐平台上开设了多个账号,包括虎虎有生气、野狐扫地僧、天下无狗 20、绝艺、骊龙、刑天等。其中「绝艺」账号运用工夫最久,对弈盘数最多,名望也最大。目前在野狐平台上有「绝艺指点」A、B、C、D 等各个小号,辨别用于对弈不同段位的棋手。
「绝艺」艺名来源:
重送绝句(杜牧)
绝艺如君天下少,闲人似我人间无。
别后竹窗风雪夜,一灯明暗覆吴图。
虽然起步晚,但是绝艺 AI 开展却很快。仅仅经过 4 个月的工夫,在 2016 年 6 月下旬,绝艺曾经打破了专业 6 段;同年 8 月便开端在腾讯旗下的野狐围棋网络对弈平台测试,8 月 23 日初次打败职业棋手,11 月 2 日第一次打败世界冠军江维杰,11 月 19 日初次交手柯洁取胜。
绝艺第一次大范围惹起关注,是 2017 年 3 月初在野狐平台上提升为「十段」高手。但实践上在此之前,它曾经打败了包括韩国围棋国手古力、连笑、朴廷桓等高手;甚至在 2 月 14 日至 2 月 24 日时期,和柯洁交手十次,无一败绩。
随后,绝艺在 2017 年 3 月 18-19 日的第 10 届 UEC 杯世界电脑围棋大会上打败了事先电脑围棋界的「第二」AI——DeepZenGo,夺得冠军。由于这次夺冠,绝艺取得了参与第 5 届电圣战的资历,在 2017 年 3 月 26 日对弈来自日本棋院的新锐棋手一力辽,并执黑 157 手中盘胜。
事情总是无挫不勇。2017 年 8 月在鄂尔多斯举行的中国围棋大会首届世界智能围棋地下赛上,「绝艺」半决赛对弈 DeepZenGo 不幸落败,未能进入决赛。此役之后,「绝艺」卧薪尝胆,不时迭代。
2017 年 11 月 15 日野狐平台上呈现了一个昵称为「契合预期」的账号,数日内鏖战 99 局,除了第 40 局被柯洁击败外,余者全胜。同时「契合预期」还对战了绝艺指点 A(UEC 杯夺冠版),在让二子的状况下,以 60 连胜完成版本晋级。
12 月 10 日在日本秋叶原举行的 2017 围棋龙星战(AI RYUSEI)决赛中,晋级版「绝艺」相继以颠簸的表现打败 MayoiGo、Raynz 和 AQ,并在决赛中再会老对手 DeepZenGo 并轻松获胜。知名棋手剑过无声(连笑)甚至评论说「绝艺可让 Zen 两子」。
进入 2018 年后,从本月 9 日开端,配备了最强地下版本的「绝艺」(野狐平台账号为「绝艺指点 A」),开端了让二子(黑帖 6 目半)对决职业棋手的行程。 截止到与柯洁对弈前,现实上「绝艺」曾经与职业棋手对弈了 31 局 27 胜 4 负。与柯洁和连笑的两场让二子对弈更是让这轮对决的意义推上了巅峰。
雷锋网理解到,就围棋 AI 对弈中让二子的成绩腾讯 AI Lab 做了以下回应:
包括 AlphaGo 在内的围棋 AI 都存在赢棋让步的成绩,缘由是 AI 以赢棋为目的,胜率过高时下哪里都赢,不一定会选择赢最多的下法。
而让子棋就是另外一种胜率过低的极端状况,以绝艺海南应战赛版本为例,这是一个分先版本的 AI,假如要求其以让 2 子开端对局,则初始胜率为 7%(让 3 子则初始胜率 1%,让 4 子则初始胜率 0.1%)。并且实力越强的版本,下让子棋时的初始胜率就越低(由于 AI 下棋时会假定对手跟本人一样)。
初始胜率过低将招致 AI 不能发扬出真正的实力,这也是如今绝艺让 2 子还不能全胜的缘由。我们最近在尝试优化算法,来处理胜率过低带来的负面影响,争取当前在让子棋里有更好的表现。
据腾讯 AI Lab 的地下旧事引见,此次与柯洁等职业棋手对弈的「绝艺」应战赛版,参考了 2017 年 10 月地下的 AlphaGo Zero 论文,并在理论中做出了改良;运用了 40 block dual-resnet 模型,以老版本的「绝艺」为根底停止强化学习,自对弈了数百万棋局,在无限的资源和工夫内,经过把强化学习和监视学习相结合来减速训练,疾速提升了棋力。
为了理解「绝艺」如此迅猛开展面前的技术细节,雷锋网 (大众号:雷锋网) AI 科技评论特别采访了「绝艺」团队的成员。
AI 科技评论:这次「绝艺」在与柯洁、连笑等职业选手的对弈中,均获得不错的成果。请问柯洁等职业棋手能否参与了「绝艺」的开发?在「绝艺」的生长中他们起到了什么样作用?
答:
柯洁没有参与绝艺的开发,但是柯洁等几十位职业棋手可以运用绝艺内测网站,「绝艺」也在腾讯野狐围棋上与棋手对弈,所以很多棋手共同见证了整个「绝艺」的生长进程。
罗洗河九段是绝艺的技术参谋,给绝艺团队围棋技术方面的指点。
AI 科技评论:经过您们的旧事理解到,这个版本的绝艺技术上次要参考了 2017 年 10 月份 deepmind 宣布的关于 AlphaGo Zero 的文章。您们对这篇文章的内容怎样评价?在详细理论中,您们做了哪些方面的改良?
答:
AlphaGo Zero 是十分让人震撼的研讨效果,除了让围棋程度到达一个新的高度,它还不依赖人类知识,让 zero 的算法具有更高的推行价值。
绝艺学习了 Zero 的 dual-resnet 模型,和绝艺老版本相比有更高效的强化学习算法。由于绝艺还在不时参与竞赛停止锤炼,比方 2017 年 12 月腾讯棋牌的「绝艺应战赛」等,所以我们没有选择从「零」开端,而是以绝艺老版本为根底停止强化学习。这样可以大幅增加训练工夫,在无限的资源和工夫内完成。目前我们曾经在开发从零开端的版本了。
AI 科技评论:相比 11 月底的「契合预期」以及 12 月中旬的「绝艺」,应战赛版的「绝艺」有哪些方面的改良? 开发这个版本的「绝艺」破费了多少工夫?
答:
绝艺近期地下亮相的三个版本之间的次要差别:
-
2017 年 11 月契合预期:20 block dual-resnet,自对弈了数十万棋局
-
2017 年 12 月日本 AI 龙星战:20 block dual-resnet,自对弈了数百万棋局
-
2017 年 12 月三亚绝艺应战赛:40 block dual-resnet,自对弈了数百万棋局
从 10 月下旬开端,用了 1 个多月工夫完成了上述三个版本的开发。
AI 科技评论:「绝艺」在多个竞赛中打败了国际上一些历史悠久的电脑围棋,请问与 DeepZenGo 等电脑围棋相比,「绝艺」有哪些方面的优势和缺乏?(例如技术、理念、团队等)
答:
我们很难复杂把「绝艺」和其他围棋 AI 停止比拟,假如回忆「绝艺」从研发到生长进程中,一直与柯洁、古力和腾讯围棋上的职业和专业棋手亲密交流与商讨。
AI 科技评论:「绝艺」团队曾经在「绝艺」的研发上做了很久的任务,请问您们对「绝艺」的定位是什么?如今绝艺曾经到达可以让二子与人类的职业选手停止竞赛了。再开发下去的意义在哪?
答:
我们以为在研讨、使用和社会价值上,「绝艺」都有其特定意义。
围棋 AI 研讨由来已久,相关的算法也不时新陈代谢。「绝艺」涵盖了人工智能最抢手的研讨范畴——深度学习和强化学习,我们在不时研发中受害良多。
从使用价值上,腾讯野狐围棋是国际最大、最活泼的的围棋平台之一,「绝艺」目前曾经有还开发了指点棋、棋赛解说等功用,也深受广阔棋迷喜欢和关注。
而在社会意义上,围棋是国粹运动,「绝艺」是腾讯推进前沿科技赋能国粹文明的代表,我们看到 AI 的每一次提高,不只发掘围棋的潜力与边界,也在展示着人类的智慧与提高。这也是 AI Lab 关于绝艺的等待——希望它能与人类棋手积极互动,从而激起更多关注并传承围棋这一中国传统文明。这是我们的一种科技责任感。
AI 科技评论:在去年三月份 UEC 世界杯大赛中的绝艺总体框架遵照的是 AlphaGo 在 2017 年 1 月份宣布的文章;而这次则次要根据 2017 年 10 月份 AlphaGo Zero 的文章。如今 Deepmind 曾经不再持续开发 AlphaGo 了。所以您们计划当前如何进一步开发绝艺的功能呢?
答:
绝艺会不断坚持开发下去,除了不时进步棋力,我们也会研讨处理一些风趣的成绩,比方如今的 AI 以获胜为目的,胜率过高时能够会让步,不一定会选择最优的下法。
腾讯将持续加大对 AI 的研讨与投入,打造世界级围棋 AI 才能与推行,更在 AI 上推进深度学习等前沿 AI 科技的研讨与使用。
相关文章:
「国产狗」胜「日本狗」,围棋龙星战腾讯绝艺报「一箭之仇」
60秒慢棋赛制“电圣战”,腾讯“绝艺”打败日本新锐棋手一力辽
专访腾讯AI Lab“绝艺”担任人:把绝艺的技术使用在其他范畴还比拟远,但我们会开放
扬名UEC杯,腾讯围棋AI“绝艺”夺冠之路全回忆!
DeepMind 的 2017:有 AlphaGo,更有社会责任
DeepMind 推出 AlphaGo 围棋教学工具,围棋学习新纪元来啦?
从AlphaGo到Libratus,百页白皮书详解机器博弈
100:0!Deepmind Nature论文提醒最强AlphaGo Zero,无需人类知识
。