樊麾:没想到被电脑5比0 人工智能帮助理解围棋

[摘要]“那对我来说也是一个历史时刻,因为我之前从来没有输给过电脑,去之前我根本没想到自己会输,觉得就是一个机器的测试嘛。第一天输完,当然是不服。第二天继续,等到第三盘之后,我已经服了。”

腾讯科技 俞斯译 3月8日报道

樊麾已经在首尔待了4天了。

他是这一次谷歌(微博) AlphaGo和 李世石“人机大战”的裁判。从3月4日开始,他就已经住进了比赛地四季酒店,帮助谷歌筹备明天即将开始的比赛。

就在几十天前,1月28日,全球最具声望的科学杂志《自然》(Nature)通过一篇封面论文,介绍了谷歌公司DeepMind团队研发的人工智能围棋程序AlphaGo。抛开那些枯燥的计算机和神经科学术语,这篇文章最大的噱头便是:AlphaGo击败了欧洲围棋冠军樊麾。

19年前,IBM的超级计算机“深蓝”(Deep Blue)击败了国际象棋大师加里•卡斯帕罗夫。从那天起,围棋就被当成了人类智力最后的堡垒,同样的也就成了人工智能研究者们最想要攻克的难题。所以你可以想象,当“一台计算机击败了围棋冠军”(还是以5:0的悬殊比分)这样的消息传出时,它的能量有多么巨大。

还没等所有人反应过来,谷歌又借势宣布,AlphaGo将在今年3月挑战世界围棋冠军,韩国棋手李世石。一片哗然之后,大家突然想起了那个关键人物,那个唯一了解发生了什么的人。

樊麾1981年出生在陕西西安,从小学棋,也算是“年少成名”,曾入选过中国国少队,围棋职业二段。2000年左右没有去当时的围棋圣地日本,而是搬到了法国,一直生活到现在。这位自称棋艺“不怎么样”的选手,现在是法国围棋队的教练,也是过去三年欧洲围棋冠军。

这些背景和title让他成为了AlphaGo理想的测验对手:有一定实力,但并没有那么高不可攀。同时又有名气,如果赢了将会是很好的宣传噱头。

当去年9月初樊麾第一次收到一封来自DeepMind的邮件时,他刚刚和太太在东欧度完一个小假,回到位于法国波尔图的家中。而他也完全料不到,这封陌生的电子邮件会给他接下去的生活带来多大的改变。

人机大战前 我们采访了那位输给机器的围棋冠军

樊麾二段

“我现在也算是个网红了。”半年之后,在接受腾讯科技采访时,樊麾在电话那头自我调侃道。

《自然》杂志的文章发表的第二天,樊麾的百度指数就呈直线上升,还有人替他建了百度百科。接下来的一个多月时间里,他的采访邀约就没有停过,“每天都在接受采访,国内的国外的,报纸、电视台。”樊麾说,这些人有的是想亲口听他说自己是真的输了,有的是想让他谈谈比赛的感受,预测一下李世石和AlphaGo谁会赢,被问到最多的是,是人工智能出现对围棋的影响。

对于这些采访请求,樊麾尽量都会答应下来,除非真的是因为比赛或是别的什么事无法配合。显然,他还没有学会如何拒绝别人,也没有太多接受采访的训练。这让他一方面看起来十分真诚,同时也容易被“不安好心的人”抓住说话的漏洞作文章。

在所有针对他的指责当中,他最无法接受的是说他被谷歌收买,整个事件就是炒作,是一个局。“对这些人我真的无话可说。”在整个采访过程中都笑哈哈的樊麾,在说这句话的时候既严肃又无奈。

抛开这些恶毒的攻击,樊麾觉得自己还是挺幸运的。在半年前,他根本没有在意过任何关于人工智能的事,在无意间卷入了这场“人机大战”,而且是作为一个最重要的角色:他不仅是现在唯一一个和AlphaGo直接交过手的人,而且也将作为它与李世石交手的裁判。他说自己正在见证历史。

去年11月13日晚间,恐怖组织袭击了巴黎。那天樊麾正好在巴黎。整个晚上,不断有家人和朋友来电发微信寻问樊麾的安危,因为太累,他与妻子待在了市郊的宾馆没有出门。这是他过去半年另一段有意思的经历。

在樊麾飞去韩国为这次“人机大战”做准备的前一天,他接受了腾讯科技的专访。他与我们详细描述了自己是怎么进入到这一事件中,是怎么一步步输给AlphaGo,又为什么在受到争议时还愿意出任裁判,以及在他眼中,人工智能会给围棋、给人类社会带来什么样的变化。

“他们说现在有一个很好的项目,他们感到很兴奋”

腾讯科技:跟我们说说,最初你是怎么被“卷”进这件事里来的。

樊麾:是在去年9月初,我刚比完欧洲围棋赛,拿了冠军,和太太在东欧那边玩了一圈。回到家发现DeepMind,就是开发了AlphaGo的那家公司给我发了封邮件,就问我有没有兴趣去他们公司访问。当时他们什么也没说,没说是程序,更没说是和围棋有关。我虽然也不知道是什么,但在欧洲这种事也比较平常,不会觉得人要骗我什么的,出于好奇,我就给他们回了邮件。

接着就是约我网上视频会议。第一次用Skple连线,也没有说是和围棋相关的项目。只是说很高兴我能过去访问,他们现在有一个很好的项目(Project),他们自己很兴奋(exciting),不过在让我了解这个项目之前,需要签一个保密协议。然后他们传过来这个协议,我签完传回去。等到第二次视频会议,才开始告诉我具体是什么。

腾讯科技:所以你是在一无所知的情况下就签了保密协议?没有什么疑惑吗?

樊麾:(笑)其实签之前我有去查过。第一次视频完了之后,我上了它们公司官网,找到了一篇之前的围棋相关的论文。那个论文写的是一个最初的概念,当然里面有很多技术我是看不懂的,不过猜到了应该是和围棋有关的,所以会找到我。当时想的应该是一个围棋程序,让我帮忙测试一下,出出点子。觉得挺好玩的。

腾讯科技:那个时候你还不知道DeepMind这家公司的背景?

樊麾:是的。第二次视频会议,DeepMind才告诉我说他们背后其实是谷歌投资的,我这才知道它们的背景比较大。我觉得它们一开始没有说一个是出于保密,第二个估计也是怕把我吓跑,不接受他们的邀约。接下来就是敲定行程。

9月底第一次去他们公司参观。那个时候纯粹就是抱着旅游的心态,去英国玩一趟。第一次就是纯聊,没有接触AlphaGo,也没有下棋。只是把比赛时间,比赛方式等等确定。比如他们会问我希望和电脑下,还是用实体的棋盘对面坐个人摆子。他们问了我很多东西,我发现他们对于人工智能方面可能很擅长。但是对于这个比赛要怎么弄,一点经验都没有;对于围棋世界,也不是很了解。

腾讯科技:为什么会觉得他们对围棋世界不了解?

樊麾:因为他们提出了很多顾及。比如他们问我,万一机器赢了,下围棋的人会不会恨他们。会不会因此伤害到很多人的利益等等。通过这些你会发现,他们是那些很纯粹的技术人员,不是商业世界里那种很油的人。

腾讯科技:你有问过他们为什么选择围棋这个课题吗?

樊麾:我也是通过和他们接触,才对人工智能这块也慢慢有了了解。人工智能里有一个共识,围棋是人类最后的一个堡垒,是最难的,所以这方面的研究人员很早以前就对人工智能下围棋有很大的兴趣。我记得2005年的时候法国就开发了一个围棋程序MoGo,第一次用了现在流行的蒙特卡洛树搜索。我还跟这个程序下过,是9乘9那种,当时并没有觉得它厉害。

后来我才知道,做这个程序的不少研究人员,后来被吸纳到了DeepMind公司来了。所以其实Goolge关注围棋不是一天两天了,只不过一直没有找到那个核心的可以带来突破的东西。

之前的围棋程序,包括Zen,CrazyStone我都跟他们下过,其实还是之前的模式,就是死算,纯计算机的方式。而AlphaGo最厉害的,是除了算的部分,还有一个另外的“判断”的部分,这就往前迈了一大步。

腾讯科技:能用普通人能听懂的话,跟我们解释一下AlphaGo和之前围棋程序最大的区别吗?

樊麾:之前所有(围棋)软件最大的毛病,就是会下一些“电脑棋”,电脑棋就是那些毫无理由的奇怪的招,跟短路了一样,可以简单理解成“昏招”。只要它下了电脑棋,和它对垒的你顺间就会充满自信,觉得不过如此,你就放松了。之前所有的围棋程序,都会下一些电脑棋。

AlphaGo最厉害之处,就是不下电脑棋,不下特别奇怪的愚蠢的棋。如果你不提前告诉我,我完全感觉不出来对面是一个程序,它下棋的方式,很像真正的人类棋手。

这还不是说我升级的概念,而是提升了一个层次。很多人看到那篇论文来找我,问我是不是真的输了。我说我虽然下的不好,但是我尽力了,是真的输了。AlphaGo的水平超出了我的想象。

“我之前从来没有输给过电脑,去之前我根本没想到自己会输”

腾讯科技:跟我们分享一下具体的比赛过程吧,是跟我想象的那种,在小黑屋里关几个小时对着机器下棋吗?

樊麾:比赛是10月初,5号到9号五天,其实是一天两场,一共10盘。5盘正式的,还有5盘非正式的快棋。正式的全输了,但非正式的快棋我赢了两盘。

就是在一个他们公司大的会议室里面,摆好了各种摄像头,其它人在外面。他们当时问我是想对着电脑下还是有棋盘,我不习惯对电脑,所以有一个技术人员跟我在里面,坐在我对面来负责下棋,就是来替AlphaGo摆子。

腾讯科技:你从什么时候发现,情况和你预想的不太一样?

樊麾:输完第一盘,我就发现(情况)不对了。按我原来的设想,第一盘是想慢慢下,你围一点,我围一点,没有什么相互的战斗,希望可以稳稳地取胜。但结果就是,这么下我下不过。所以从第二盘开始,我就完全改变了策略和棋风,开始主动出击与它展开攻杀,说不定它会出现失误,就会变成我的机会。没想到反而输得更多。

腾讯科技:那个时候你是什么心情?

樊麾:那对我来说也是一个历史时刻,因为我之前从来没有输给过电脑,去之前我根本没想到自己会输,觉得就是一个机器的测试嘛。第一天输完,当然是不服。第二天继续,等到第三盘之后,我已经服了。但是它规则要求你下完五盘嘛,知道下不过,但是还想着说也许我能赢一盘。最后就是0比5。

腾讯科技:你自己也说,其实当时发挥也不是很好。是什么原因造成的?太紧张了吗?

樊麾:就像咱们前面说的,如果你不告诉我对面是一个程序,从它下棋的方式上我是感觉不到的。但是之前人家又明明告诉你了,对面和你下棋的不是人。这个就很别扭。

两个人下棋的时候,你常常会观察和琢磨对方的情感和心理。它是紧张了,害怕了,你在想象对方的同时,这种作用对方也会感到到,折射回来。但是现在对面是电脑,就是你面对一堵墙,你所有的感觉全部都被打了回来,你知道它没有心态的波动。

腾讯科技:你接收不到来自对手的任何信息。

樊麾:是的。直接影响就是,你无时无刻不在怀疑自己。这个棋它这么下对吗,真的对吗,我有这么多问题吗,因为下了两盘你发现它不会出错,它的错只是它那个水平上的错,不会有其它原因的错。我的心理波动就大了,下到后来我觉得,即使我优势再大最后也会输。如果我们再下10盘,我会输得更多。

腾讯科技:但其实一开始你下的还是挺自信的吧?

樊麾:对。第一盘是我唯一不怀疑自己的,因为那时候我还什么都不知道呢。随着比赛进行,加上后来和DeepMind的人聊天,对AlphaGo了解加深,从最初的模型,到不断测试,包括技术人员中间的讲解,知道这个程序是怎么回事了,发现这个东西不可限量。终于感受到了当初他们联系我时说的那种兴奋(exciting)。

腾讯科技:但你确实是被虐了,不会很郁闷吗?

樊麾:这个事情曝出来今年1月27号,已经离比赛过去好几个月了,心态早就平和了(笑)。

腾讯科技:但是这个消息一出来,大家就都来轰炸你了。

樊麾:就消息出来第二天,所有朋友都在微信上问我,“樊麾,这事儿真的假的”,我说是真的。接着就是媒体找上来,从那个时候开始媒体采访就没有停过。国内的,国外的,这两天比赛近了嘛,韩国的媒体,包括最大的报纸、电视台也都找过来。我开玩笑说现在真成“网红”了。

腾讯科技:大家一方面都想要采访你,但其中不少的报道,都是把你放在AlphaGo垫脚石这样一个位置,你会不高兴吗?

樊麾:这到没什么,我本来就不是围棋水平特别高的人。输了就是输了,对我水平的那些质疑我都接受。最让我没法接受的是说我被谷歌收买了,到现在还有人说,这整个事情就是一个炒作。这我就没法说了。

还有一个有意思的事,DeepMind公司的人看到网上各种各样的话,还特地给我发了一封邮件慰问我。他们都知道,其中有一些话,已经算是带有人身攻击了。

“如果AlphaGo停留在半年前跟我比赛那个水平,那它对李世石毫无胜算。”

腾讯科技:既然已经有这些压力,为什么还答应来当这次人机大战的裁判?

樊麾:当然答应,我很爽愉就答应了。这都是见证历史的时刻。你知道,围棋比赛当中会发生很多细节,如果我不在现场,就错过这些细节了。围棋里面有一种叫“观战记者”的,里头最有名的是川端康成,就是拿诺贝尔文学奖那位,他之间做过这个。围棋比赛里面这些细节,都是很有故事的事情,我一定不会错过的。

腾讯科技:这次作为裁判主要任务是什么?

樊麾:主要就是下完了数棋吧(笑)。当然,如果中间李世石有什么疑问也可以马上问我。

腾讯科技:你觉得李世石能为你“报仇”吗?

樊麾:我没法预测,我对媒体都这么说。这是真的。如果AlphaGo停留在半年前跟我比赛那个水平,那它对李世石毫无胜算。但是它最强大的地方就是学习能力,DeepMind过去这几个月都在努力让它变得更强大。

腾讯科技:你应该有参与到其中吧?能跟我们透露一些吗?

樊麾:我们签了保密协议,所以这个没法回答了。(那你中间见过DeepMind的人吗?)见过,只能说这么多了(大笑)。

腾讯科技:好的我们换个问题,从输了比赛到消息曝出来中间隔了三个月,你都没法跟任何人说这件事,这段时间是怎么度过的?

樊麾:这种感觉是挺难受的,就是全世界,就你一个人知道了这个惊天秘密,你又没法跟别人分享。中间还碰到一个挺有意思的事。11月份在法国有一个围棋的冬令营,其中有一个韩国老师,吃饭的时候兴高采烈地跟我们说,我最近跟CrazyStone打,让三个子我还赢了。我在那里心里是偷笑,心想你们都没见识过AlphaGo呢,但是什么也不能说啊,只能低头吃饭。另外我在网上查了很多关于人工智能的东西,进一步了解吧,然后基本上该怎么过怎么过。

腾讯科技:有一种说法是,即便这次AlphaGo赢不了李世石,下一次,下下次,或许几年后人类棋手就完全不是它的对手了,就像当初的IBM深蓝一样,作为一个靠围棋吃饭的人,你会有这方面的担忧吗?

樊麾:不会。我觉得现在人类对围棋的理解不超过10%,咱们自己都不了解什么是围棋。围棋是一个典型的东方的东西,最简单,但是最有力量。如果人工智能能帮助我们更好地理解围棋,我不觉得是一种威胁。

而且往近里说,自从这个事情出来之外,整个欧洲国家,基本上每家的官网,当月的访问量都是前一个月的10倍。这对围棋运动的推广来说绝对是一件好事啊。

腾讯科技:所以你对人工智能的发展也是抱着一种乐观态度?

樊麾:可以这么说吧,我觉得我们不会让人工智能的发展威胁到人类。你现在反过头来看历史上的那些发明,照相机、火车、轮船,照相机刚发明的时候被当成的巫术,现在想想多么可笑啊,我觉得人工智能也和这些也没有区别。

你想想,我们每年发生的自然灾害有多少。人类面对这些灾害有多无助,这还只是局部的灾难,如果某一天有了全球性的灾难怎么办?也许到时候人工智能真的能帮助到我们。你说有没有可能发展成为《黑客帝国》里那样的,当然有可能,可能性多大,谁也不知道。但你不能因为这个就止步不前。

而且人工智能和人不一样,它对权威没有任何概念。它的脑子里没有生存,权力,金钱这些概念。它为什么要跟人搞事?我觉得人工智能只会是保护人的利益,一起建造更好的文明。

正文已结束,您可以按alt+4进行评论

相关搜索:

热门推荐

看过本文的人还看了

读完这篇文章后,您心情如何?
[责任编辑:beppekong]

热门搜索:

    企业服务