注册 投稿
经济金融网 中国经济学教育科研网 中国经济学年会 EFN通讯社

Master就是AlphaGo升级版!60连胜背后看专家怎么评说

\
(原文来自微信公众号“新智元”(ID:AI_era),作者弗格森、序媛,本文转自36Kr)

2017年1月4日晚上,Master 完胜第59盘棋的时候,突然发声自认:“我是 AlphaGo 的黄博士”,Master之前以横扫千军的姿态战胜几乎所有中国的围棋大师,包括“棋圣”聂卫平和柯洁。本文带来新智元智库专家白硕、邓侃的独家解读。同时,国内围棋AI 的一名开发者也透露了他的看法:Master的水平略有些让人失望。新智元还采访了中国围棋队总教练俞斌,他在文中谈了自己的看法和理解。这一次,机器可能不再借用人类经验,而是凭借自我对弈和学习战胜了人类,让人类认识到另一个“真理”的存在。从某种程度上来说,这是一个新的“纪元”的开启。

1月4日晚间,此前横扫围棋界的神秘大师“Master” 忽然发声,自亮身份,它写道:我是AlphaGo 黄博士。
\

此时,Master 刚刚取得第59场不败纪录,将对战人类棋手的纪录变为59:0。此前,人们的猜测是Master在完成60场比赛后,会隐退,或者发声。但是,没有人想到,在59场的时候,Master自己亮明了身份。

官方声明:
\
Master 已经在线上平台上接连战胜了聂卫平、柯洁、朴廷桓、唐韦星、范廷钰、王古力、周俊勋和黄云嵩等多位围棋高手。

战胜“棋圣”,黄博士是谁?

2017年下午3点04分,聂卫平执白3又1/4子之差负于Master,Master取得第54胜!

聂卫平在围棋圈有“棋圣”之称,只是这次,他也拿Master没办法。对弈结束后,Master 用繁体字打出了“谢谢聂老师”的消息。这个时候,其实Master的身份已经有所暗示了。后来Master所说的“黄博士”,指的是黄士杰博士。黄博士是台湾人,习惯用繁体。

如果大家有看3月份李世石与 AlphaGo 的对奕的话,应该会注意到在李世石对面有个将 AlphaGo 的棋步下到棋盘,并且将李世石的棋步再输到电脑上的人。这位就是谷歌 DeepMind 的资深研究员,也是 AlphaGo 的主要程序开发者,台湾出身的黄士杰博士。

\

黄士杰(前左)在替AlphaGo 执子

黄士杰博士毕业于台湾师范大学,博士论文就是以“应用于电脑围棋之蒙地卡罗树搜索法的新启发式演算法”,本身也是业余六段的围棋棋手。

此前,黄士杰在接受Engadget的采访时曾说,如果再给 AlphaGo 一年半载的话,说不定李世石真的就是史上唯一赢过 AlphaGo 一场的人了...

果然,半载之后,我们看到令人叹服的结果。

Master的技术没有想象的那么好?

对于此次掀起风暴的Master,新智元智库专家白硕评价说:

第一,并不意外。如果世界上还有另外一个团队达到这样的水平反而是意外。

第二,又有进步。现在的AlphaGo水平比去年战胜李世石的时候发挥更稳定、对人类棋手更有启发性,对人类观众更有观赏性,导致人类对棋理的认识正在酝酿重大的突破。

第三,还有潜力。按现在势头发展,基于对弈棋谱的深度学习和基于左右互搏的增强学习正在形成良性互动的局面,但愿这一阶段不要过快结束(否则就跑步进入机器跟人类没得可学的阶段了)。

第四,除了不断增强对弈能力外,让机器以人类能理解的方式讲述其棋路,以全新的体验变革人类传授和学习围棋的方式,其意义不亚于战胜人类。

新智元问及其他的机器包括国内的一些围棋AI是否有机会超越Master呢?是否需要重大算法突破才能破解Master的时间积累优势?

白硕说:“我知道有人在做。如果能大幅提高算法的效率,就意味着在同样时间内可以遍历更多有意义的变化,增强学习会做得越好。个人判断,算法上的优化仍有空间,赶超仍有机会。未来机器之间的对弈会是新的看点。”

然而,也有专业人士表示有些失望。一位要求匿名的中国某大型互联网公司AI开发者对新智元表示,Master 横扫人类棋手毫不意外,但是对过程有点失望,Master的技术没有想象的那么好,毕竟去年7月份 Aja Huang 在一次演讲中透漏可以让顶尖棋手2子,半年过去了,看不出一定能让2子。也许这并不是最新版。

棋风奔放怪异,因为没有学习过人类棋谱?

在DeepMind官宣之前,“Master”的身份激发了多方猜测,有不少人认为这就是AlphaGo的升级版,但与后者不同的是“Master”的招法极其奔放,推翻了很多人类棋手常走的定式,棋风与去年3月的AlphaGo大不相同。  

值得注意的是,DeepMind公司创始人Hassabis 曾在一次采访中透露,他们正在尝试训练一个没有学习过人类棋谱的人工智能,而这可能就是Master和AlphaGo不同的原因。

CMU 博士邓侃对新智元表示:

3月份AlphaGo 与李世石对决第一盘,取得胜利后,就说明算法已经超越人类顶级高手。接下去的几盘,AlphaGo 赢了,这是预料之中。输了一盘,反倒有点奇怪。因为算法只会越变越强大。
随着训练越来越强化,AlphaGo 的棋艺越来越精致,这是自然而然的趋势。战胜所有人类高手,只不过是时间的问题。但是看不出 (现在的)AlphaGo 的算法,有本质突破。至少没有读到 DeepMind 在这个领域的新论文。
AlphaGo 系统中,有  Monte Carlo tree search(蒙特卡洛树搜索),不妨把它理解为左右手互博。互博时间越长,实际上就是把各种可能的对弈方案,统统演练一遍。所以,AlphaGo 的训练时间越长,它对各种对弈方案的了解就越全面。
在自我对弈中成长起来的新AlphaGo,可能完全不需要人类棋谱。

被认为与AlphaGo“必有一战”的世界第一柯洁,在这次对战中也败下阵来,但是柯洁在微博上写的感想倒是很值得深思。

他写道:“新的风暴即将来袭。我从3月份到现在研究了大半年的棋软,无数次的理论、实践,就是想知道计算机到底强在哪里。昨夜辗转反侧,不想竟一夜难眠,人类数千年的实战演练进化,计算机却告诉我们人类全是错的。我觉得,甚至没有一个人沾到围棋真理的边。但我想说,从现在开始,我们棋手将结合计算机,迈进全新的领域达到全新的境界。 

专访中国围棋队总教练俞斌:慢棋是人类最后的机会,但是悬念不大

在Master身份明确后,新智元第一时间联系了中国围棋队总教练俞斌进行专访。

新智元:您觉得人类棋手还有机会吗? 

俞斌:基本上没有。只留有一丝悬念,就是长时间的慢棋,但只是悬念,我判断慢棋也不行。

新智元:如果下慢棋,人类棋手最后的突破口可能是什么呢?

俞斌:慢棋人的错误会少很多,但能否一争胜负有悬念。感觉可能性很小。

新智元:之前有人认为,人类棋手以后只和人类比,而机器棋手只会和机器棋手对决了,您认为围棋最后是这样嘛?

俞斌:人与人比会,机器与机器比也有,但不会只是这两种。人与机器,人带机器,用时、让子等等,还是会有不少比的类型的。也许会有机器参加的团队赛等等

新智元:看来机器的加入反而有了更多玩法。那么您认为机器的出现,看起来像人类的天花板,人类围棋是否会放下胜负心,真正实现人和人对围棋本身的享受呢?

俞斌:哲学问题

(责任编辑:郭倩荷)
文章评论
关注我们

快速入口
回到顶部
深圳网站建设