樊麾:没想到被电脑5比0 人工智能帮助理解围棋

棋牌腾讯科技 [微博] 2016-03-08 15:05

我要分享

[摘要]“那对我来说也是一个历史时刻，因为我之前从来没有输给过电脑，去之前我根本没想到自己会输，觉得就是一个机器的测试嘛。第一天输完，当然是不服。第二天继续，等到第三盘之后，我已经服了。”

自动播放开关 自动播放

李世石：输棋是围棋的一部分我将捍卫人类荣誉

正在加载...

< >

腾讯科技俞斯译 3月8日报道

樊麾已经在首尔待了4天了。

他是这一次谷歌(微博) AlphaGo和李世石“人机大战”的裁判。从3月4日开始，他就已经住进了比赛地四季酒店，帮助谷歌筹备明天即将开始的比赛。

就在几十天前，1月28日，全球最具声望的科学杂志《自然》（Nature）通过一篇封面论文，介绍了谷歌公司DeepMind团队研发的人工智能围棋程序AlphaGo。抛开那些枯燥的计算机和神经科学术语，这篇文章最大的噱头便是：AlphaGo击败了欧洲围棋冠军樊麾。

19年前，IBM的超级计算机“深蓝”（Deep Blue）击败了国际象棋大师加里•卡斯帕罗夫。从那天起，围棋就被当成了人类智力最后的堡垒，同样的也就成了人工智能研究者们最想要攻克的难题。所以你可以想象，当“一台计算机击败了围棋冠军”（还是以5:0的悬殊比分）这样的消息传出时，它的能量有多么巨大。

还没等所有人反应过来，谷歌又借势宣布，AlphaGo将在今年3月挑战世界围棋冠军，韩国棋手李世石。一片哗然之后，大家突然想起了那个关键人物，那个唯一了解发生了什么的人。

樊麾1981年出生在陕西西安，从小学棋，也算是“年少成名”，曾入选过中国国少队，围棋职业二段。2000年左右没有去当时的围棋圣地日本，而是搬到了法国，一直生活到现在。这位自称棋艺“不怎么样”的选手，现在是法国围棋队的教练，也是过去三年欧洲围棋冠军。

这些背景和title让他成为了AlphaGo理想的测验对手：有一定实力，但并没有那么高不可攀。同时又有名气，如果赢了将会是很好的宣传噱头。

当去年9月初樊麾第一次收到一封来自DeepMind的邮件时，他刚刚和太太在东欧度完一个小假，回到位于法国波尔图的家中。而他也完全料不到，这封陌生的电子邮件会给他接下去的生活带来多大的改变。

人机大战前我们采访了那位输给机器的围棋冠军

樊麾二段

“我现在也算是个网红了。”半年之后，在接受腾讯科技采访时，樊麾在电话那头自我调侃道。

《自然》杂志的文章发表的第二天，樊麾的百度指数就呈直线上升，还有人替他建了百度百科。接下来的一个多月时间里，他的采访邀约就没有停过，“每天都在接受采访，国内的国外的，报纸、电视台。”樊麾说，这些人有的是想亲口听他说自己是真的输了，有的是想让他谈谈比赛的感受，预测一下李世石和AlphaGo谁会赢，被问到最多的是，是人工智能出现对围棋的影响。

对于这些采访请求，樊麾尽量都会答应下来，除非真的是因为比赛或是别的什么事无法配合。显然，他还没有学会如何拒绝别人，也没有太多接受采访的训练。这让他一方面看起来十分真诚，同时也容易被“不安好心的人”抓住说话的漏洞作文章。

在所有针对他的指责当中，他最无法接受的是说他被谷歌收买，整个事件就是炒作，是一个局。“对这些人我真的无话可说。”在整个采访过程中都笑哈哈的樊麾，在说这句话的时候既严肃又无奈。

抛开这些恶毒的攻击，樊麾觉得自己还是挺幸运的。在半年前，他根本没有在意过任何关于人工智能的事，在无意间卷入了这场“人机大战”，而且是作为一个最重要的角色：他不仅是现在唯一一个和AlphaGo直接交过手的人，而且也将作为它与李世石交手的裁判。他说自己正在见证历史。

去年11月13日晚间，恐怖组织袭击了巴黎。那天樊麾正好在巴黎。整个晚上，不断有家人和朋友来电发微信寻问樊麾的安危，因为太累，他与妻子待在了市郊的宾馆没有出门。这是他过去半年另一段有意思的经历。

在樊麾飞去韩国为这次“人机大战”做准备的前一天，他接受了腾讯科技的专访。他与我们详细描述了自己是怎么进入到这一事件中，是怎么一步步输给AlphaGo，又为什么在受到争议时还愿意出任裁判，以及在他眼中，人工智能会给围棋、给人类社会带来什么样的变化。

“他们说现在有一个很好的项目，他们感到很兴奋”

腾讯科技：跟我们说说，最初你是怎么被“卷”进这件事里来的。

樊麾：是在去年9月初，我刚比完欧洲围棋赛，拿了冠军，和太太在东欧那边玩了一圈。回到家发现DeepMind，就是开发了AlphaGo的那家公司给我发了封邮件，就问我有没有兴趣去他们公司访问。当时他们什么也没说，没说是程序，更没说是和围棋有关。我虽然也不知道是什么，但在欧洲这种事也比较平常，不会觉得人要骗我什么的，出于好奇，我就给他们回了邮件。

接着就是约我网上视频会议。第一次用Skple连线，也没有说是和围棋相关的项目。只是说很高兴我能过去访问，他们现在有一个很好的项目（Project），他们自己很兴奋（exciting)，不过在让我了解这个项目之前，需要签一个保密协议。然后他们传过来这个协议，我签完传回去。等到第二次视频会议，才开始告诉我具体是什么。

腾讯科技：所以你是在一无所知的情况下就签了保密协议？没有什么疑惑吗？

樊麾：（笑）其实签之前我有去查过。第一次视频完了之后，我上了它们公司官网，找到了一篇之前的围棋相关的论文。那个论文写的是一个最初的概念，当然里面有很多技术我是看不懂的，不过猜到了应该是和围棋有关的，所以会找到我。当时想的应该是一个围棋程序，让我帮忙测试一下，出出点子。觉得挺好玩的。

腾讯科技：那个时候你还不知道DeepMind这家公司的背景？

樊麾：是的。第二次视频会议，DeepMind才告诉我说他们背后其实是谷歌投资的，我这才知道它们的背景比较大。我觉得它们一开始没有说一个是出于保密，第二个估计也是怕把我吓跑，不接受他们的邀约。接下来就是敲定行程。

9月底第一次去他们公司参观。那个时候纯粹就是抱着旅游的心态，去英国玩一趟。第一次就是纯聊，没有接触AlphaGo，也没有下棋。只是把比赛时间，比赛方式等等确定。比如他们会问我希望和电脑下，还是用实体的棋盘对面坐个人摆子。他们问了我很多东西，我发现他们对于人工智能方面可能很擅长。但是对于这个比赛要怎么弄，一点经验都没有；对于围棋世界，也不是很了解。

腾讯科技：为什么会觉得他们对围棋世界不了解？

樊麾：因为他们提出了很多顾及。比如他们问我，万一机器赢了，下围棋的人会不会恨他们。会不会因此伤害到很多人的利益等等。通过这些你会发现，他们是那些很纯粹的技术人员，不是商业世界里那种很油的人。

腾讯科技：你有问过他们为什么选择围棋这个课题吗？

樊麾：我也是通过和他们接触，才对人工智能这块也慢慢有了了解。人工智能里有一个共识，围棋是人类最后的一个堡垒，是最难的，所以这方面的研究人员很早以前就对人工智能下围棋有很大的兴趣。我记得2005年的时候法国就开发了一个围棋程序MoGo，第一次用了现在流行的蒙特卡洛树搜索。我还跟这个程序下过，是9乘9那种，当时并没有觉得它厉害。

后来我才知道，做这个程序的不少研究人员，后来被吸纳到了DeepMind公司来了。所以其实Goolge关注围棋不是一天两天了，只不过一直没有找到那个核心的可以带来突破的东西。

之前的围棋程序，包括Zen，CrazyStone我都跟他们下过，其实还是之前的模式，就是死算，纯计算机的方式。而AlphaGo最厉害的，是除了算的部分，还有一个另外的“判断”的部分，这就往前迈了一大步。

腾讯科技：能用普通人能听懂的话，跟我们解释一下AlphaGo和之前围棋程序最大的区别吗？

樊麾：之前所有（围棋）软件最大的毛病，就是会下一些“电脑棋”，电脑棋就是那些毫无理由的奇怪的招，跟短路了一样，可以简单理解成“昏招”。只要它下了电脑棋，和它对垒的你顺间就会充满自信，觉得不过如此，你就放松了。之前所有的围棋程序，都会下一些电脑棋。

AlphaGo最厉害之处，就是不下电脑棋，不下特别奇怪的愚蠢的棋。如果你不提前告诉我，我完全感觉不出来对面是一个程序，它下棋的方式，很像真正的人类棋手。

这还不是说我升级的概念，而是提升了一个层次。很多人看到那篇论文来找我，问我是不是真的输了。我说我虽然下的不好，但是我尽力了，是真的输了。AlphaGo的水平超出了我的想象。

“我之前从来没有输给过电脑，去之前我根本没想到自己会输”

腾讯科技：跟我们分享一下具体的比赛过程吧，是跟我想象的那种，在小黑屋里关几个小时对着机器下棋吗？

樊麾：比赛是10月初，5号到9号五天，其实是一天两场，一共10盘。5盘正式的，还有5盘非正式的快棋。正式的全输了，但非正式的快棋我赢了两盘。

就是在一个他们公司大的会议室里面，摆好了各种摄像头，其它人在外面。他们当时问我是想对着电脑下还是有棋盘，我不习惯对电脑，所以有一个技术人员跟我在里面，坐在我对面来负责下棋，就是来替AlphaGo摆子。

腾讯科技：你从什么时候发现，情况和你预想的不太一样？

樊麾：输完第一盘，我就发现（情况）不对了。按我原来的设想，第一盘是想慢慢下，你围一点，我围一点，没有什么相互的战斗，希望可以稳稳地取胜。但结果就是，这么下我下不过。所以从第二盘开始，我就完全改变了策略和棋风，开始主动出击与它展开攻杀，说不定它会出现失误，就会变成我的机会。没想到反而输得更多。

腾讯科技：那个时候你是什么心情？

樊麾：那对我来说也是一个历史时刻，因为我之前从来没有输给过电脑，去之前我根本没想到自己会输，觉得就是一个机器的测试嘛。第一天输完，当然是不服。第二天继续，等到第三盘之后，我已经服了。但是它规则要求你下完五盘嘛，知道下不过，但是还想着说也许我能赢一盘。最后就是0比5。

腾讯科技：你自己也说，其实当时发挥也不是很好。是什么原因造成的？太紧张了吗？

樊麾：就像咱们前面说的，如果你不告诉我对面是一个程序，从它下棋的方式上我是感觉不到的。但是之前人家又明明告诉你了，对面和你下棋的不是人。这个就很别扭。

两个人下棋的时候，你常常会观察和琢磨对方的情感和心理。它是紧张了，害怕了，你在想象对方的同时，这种作用对方也会感到到，折射回来。但是现在对面是电脑，就是你面对一堵墙，你所有的感觉全部都被打了回来，你知道它没有心态的波动。

腾讯科技：你接收不到来自对手的任何信息。

樊麾：是的。直接影响就是，你无时无刻不在怀疑自己。这个棋它这么下对吗，真的对吗，我有这么多问题吗，因为下了两盘你发现它不会出错，它的错只是它那个水平上的错，不会有其它原因的错。我的心理波动就大了，下到后来我觉得，即使我优势再大最后也会输。如果我们再下10盘，我会输得更多。

腾讯科技：但其实一开始你下的还是挺自信的吧？

樊麾：对。第一盘是我唯一不怀疑自己的，因为那时候我还什么都不知道呢。随着比赛进行，加上后来和DeepMind的人聊天，对AlphaGo了解加深，从最初的模型，到不断测试，包括技术人员中间的讲解，知道这个程序是怎么回事了，发现这个东西不可限量。终于感受到了当初他们联系我时说的那种兴奋（exciting）。

腾讯科技：但你确实是被虐了，不会很郁闷吗？

樊麾：这个事情曝出来今年1月27号，已经离比赛过去好几个月了，心态早就平和了（笑）。

腾讯科技：但是这个消息一出来，大家就都来轰炸你了。

樊麾：就消息出来第二天，所有朋友都在微信上问我，“樊麾，这事儿真的假的”，我说是真的。接着就是媒体找上来，从那个时候开始媒体采访就没有停过。国内的，国外的，这两天比赛近了嘛，韩国的媒体，包括最大的报纸、电视台也都找过来。我开玩笑说现在真成“网红”了。

腾讯科技：大家一方面都想要采访你，但其中不少的报道，都是把你放在AlphaGo垫脚石这样一个位置，你会不高兴吗？

樊麾：这到没什么，我本来就不是围棋水平特别高的人。输了就是输了，对我水平的那些质疑我都接受。最让我没法接受的是说我被谷歌收买了，到现在还有人说，这整个事情就是一个炒作。这我就没法说了。

还有一个有意思的事，DeepMind公司的人看到网上各种各样的话，还特地给我发了一封邮件慰问我。他们都知道，其中有一些话，已经算是带有人身攻击了。

“如果AlphaGo停留在半年前跟我比赛那个水平，那它对李世石毫无胜算。”

腾讯科技：既然已经有这些压力，为什么还答应来当这次人机大战的裁判？

樊麾：当然答应，我很爽愉就答应了。这都是见证历史的时刻。你知道，围棋比赛当中会发生很多细节，如果我不在现场，就错过这些细节了。围棋里面有一种叫“观战记者”的，里头最有名的是川端康成，就是拿诺贝尔文学奖那位，他之间做过这个。围棋比赛里面这些细节，都是很有故事的事情，我一定不会错过的。

腾讯科技：这次作为裁判主要任务是什么？

樊麾：主要就是下完了数棋吧（笑）。当然，如果中间李世石有什么疑问也可以马上问我。

腾讯科技：你觉得李世石能为你“报仇”吗？

樊麾：我没法预测，我对媒体都这么说。这是真的。如果AlphaGo停留在半年前跟我比赛那个水平，那它对李世石毫无胜算。但是它最强大的地方就是学习能力，DeepMind过去这几个月都在努力让它变得更强大。

腾讯科技：你应该有参与到其中吧？能跟我们透露一些吗？

樊麾：我们签了保密协议，所以这个没法回答了。（那你中间见过DeepMind的人吗？）见过，只能说这么多了（大笑）。

腾讯科技：好的我们换个问题，从输了比赛到消息曝出来中间隔了三个月，你都没法跟任何人说这件事，这段时间是怎么度过的？

樊麾：这种感觉是挺难受的，就是全世界，就你一个人知道了这个惊天秘密，你又没法跟别人分享。中间还碰到一个挺有意思的事。11月份在法国有一个围棋的冬令营，其中有一个韩国老师，吃饭的时候兴高采烈地跟我们说，我最近跟CrazyStone打，让三个子我还赢了。我在那里心里是偷笑，心想你们都没见识过AlphaGo呢，但是什么也不能说啊，只能低头吃饭。另外我在网上查了很多关于人工智能的东西，进一步了解吧，然后基本上该怎么过怎么过。

腾讯科技：有一种说法是，即便这次AlphaGo赢不了李世石，下一次，下下次，或许几年后人类棋手就完全不是它的对手了，就像当初的IBM深蓝一样，作为一个靠围棋吃饭的人，你会有这方面的担忧吗？

樊麾：不会。我觉得现在人类对围棋的理解不超过10%，咱们自己都不了解什么是围棋。围棋是一个典型的东方的东西，最简单，但是最有力量。如果人工智能能帮助我们更好地理解围棋，我不觉得是一种威胁。

而且往近里说，自从这个事情出来之外，整个欧洲国家，基本上每家的官网，当月的访问量都是前一个月的10倍。这对围棋运动的推广来说绝对是一件好事啊。

腾讯科技：所以你对人工智能的发展也是抱着一种乐观态度？

樊麾：可以这么说吧，我觉得我们不会让人工智能的发展威胁到人类。你现在反过头来看历史上的那些发明，照相机、火车、轮船，照相机刚发明的时候被当成的巫术，现在想想多么可笑啊，我觉得人工智能也和这些也没有区别。

你想想，我们每年发生的自然灾害有多少。人类面对这些灾害有多无助，这还只是局部的灾难，如果某一天有了全球性的灾难怎么办？也许到时候人工智能真的能帮助到我们。你说有没有可能发展成为《黑客帝国》里那样的，当然有可能，可能性多大，谁也不知道。但你不能因为这个就止步不前。

而且人工智能和人不一样，它对权威没有任何概念。它的脑子里没有生存，权力，金钱这些概念。它为什么要跟人搞事？我觉得人工智能只会是保护人的利益，一起建造更好的文明。

正文已结束，您可以按alt+4进行评论