AlphaGo最核心的能力是判断势力范围,其最薄弱的是一开始的布局阶段。人类棋手要战胜人工智能,首先要给电脑选择的分支尽量地多,让其意图模糊,同时人类棋手要尽量隐藏自己的意图。
3月9日至3月15日,谷歌AlphaGo在韩国首尔与李世石进行5场挑战赛,最终AlphaGo战胜李世石,连续取得三场胜利。接下来两场将沦为李世石的“荣誉之战”。
分析:罗洗河
整理:《财经》记者 孙爱民
实习生 李名清、侯力嘉、闵敏
人机大战第三局,从刚开始的接触战,李世石就崩溃了,但在后半盘,李世石却很顽强。
明知全世界都在直播人机对战,李世石也顾不上面子了,这回是真正的在测试AlphaGo,下出各种很难看的棋去调戏电脑。电脑的应对,从人类角度看有点失误,但它还是赢了。由于前面占据了巨大优势,AlphaGo在后面的失误只是个概率问题。
为什么李世石一开始出现大面积的崩溃?我发现人类棋手与人工智能对战,棋手给电脑可选择的分支不能表示得太明确,一旦太明确人工智能就能显示强大的力量。一旦你的未知面被抓住,电脑的战斗力是非常强的,从这盘棋可以很明显地看出来。
从结构上看,这盘棋对专业棋手自身会有很大触动:棋手很模糊的地方,一旦和电脑接触,毛病就显示出来了。
比如,黑棋第11手,当时拆边,人类棋手会觉得拆这里可以,往左右一两步也可以,好像只是一两个的差别,但是能直接体现出布局的意图和结构。这样的话,电脑会展现很有力的反击。
在作战的过程中,黑棋的第21手不是很紧凑,当时21的右上一路是比较普通的打。
黑棋第27手下立,我觉得是个问题,应该是29长,那样损失不会像实战那么大。而实战中,下到第30手黑棋已经损失惨重。李世石越着急差距越大,到最后,他确实很努力地在测试电脑,放开了,不像前面那么拘谨。
李世石从第59手开始测试AlphaGo,但当时亏损了;后来到了损失惨重的阶段,从第77手开始,李世石就完全放开了,下得有点high。
人类间的对局,左上下完之后,对局基本已经结束了,因为当时优劣差距已经很大了。
AlphaGo第三局下方被黑棋出棋,看起来是一个失误,即便是一个业余选手,也能吃成净杀,不会出棋。但是当时电脑前面的优势很大了,已经胜定,这种选择是否算是失误很难判断。
电脑对失误没有概念,只是根据估值系统来演算,最后返回两个数值:首先分析的是自己赢的概率,然后是当前局面下不同下法的最大价值。这个估值系统有可能是程序员拍脑袋设计出来的,也有可能是电脑自己演化出来的。
人类棋手怎么才能战胜AlphaGo?
根据我对这三局的观察发现,AlphaGo最核心的能力是判断势力范围,这种能力依靠的可能是一种很复杂的算法。我认为AlphaGo最薄弱的是一开始的布局阶段。
电脑只是一个机器,对于定式、形状的美好是没有感觉的,对它来说只有一个概念,那就是势力范围。
在布局阶段,对阵双方都没有什么势力范围,只是一步一步往下才会慢慢产生,所以这时候电脑是没有目的感与方向感的。但它还是依照人类的一些谱上的下法来模仿。在模仿的过程中,它各个地方的势力范围是分头计算加起来的,中间没有连贯性。我觉得,这可能是人在布局的时候扩大优势的一个办法。
到棋局的最后,势力范围差不多已经基本确定了,人工智能只需要把自己的势力范围连起来,或者去分拆人类棋手的势力范围,然后通过不断的比较来判断出哪个是最大的。这时,人类棋手的机会已经寥寥无几了。
在势力范围的思路下,如果像第三盘中那样,人工智能执白棋,执黑棋的人类棋手若太早暴露自己的思路,就会给电脑一个很窄的分支。相反,如果黑棋没有过早显示出自己的意图来,就会对自己有利。
这三盘棋中,相对来说,李世石在第二盘棋的开局情况最好的,他在前60手还是有优势的。但是紧接着的第62、64手,李世石陷于一种情绪上的波动,下缓了。
这三盘棋,李世石还是以人类的思考方式在很努力地去完成。但是,他已不是当时的巅峰时期,他也那么不自信了,在后半盘会显示出一些弱点。毕竟对手每盘棋都是靠很多盘的穷举来下,李世石压力很大。
综上,人工智能根据变化来推演的能力非常强,唯一的破绽可能是在其执黑棋时,在布局阶段,即前60手显示不出主动性。这从第二局AlphaGo前60手的表现就可以看出,可是当时李世石的白棋应对不太好。
到60手时,很多职业选手认为黑棋是吃亏的,但是第62手、64手,李世石就把占到的便宜送出去很多。人类棋手的估值系统毕竟并不是数字化的,是很模糊的。
对于接下来的两局,我建议李世石首先要知道电脑跟他下的不是同一种棋。他下的围棋是在构思、在构图,在进攻或者防守;但对于电脑来说,它只有一种势力范围的概念,在具体的接触战中,是靠穷举的。
电脑的有限穷举,依赖于原来的棋谱库与常见形状的数据,所要做的就是演化,来得出一个综合的概率。演化的核心是势力范围的估值系统,人类棋手只有让这个系统混乱,才有可能战胜电脑。
因此,人类棋手要想建立起良好的局面,必须要有势力范围的概念,让棋盘上势力范围的构成更加复杂。
比如,这三盘棋,第一盘中,李世石在第7步连了个片,他觉得这地方形成自己的势力范围,电脑在这块儿实际上就让给他了;第二盘棋中,电脑很早就在实现自己的势力范围,但李世石是白棋,属于防守一方,相对来说还比较安全;第三盘李世石就想尽快扩张自己的势力,走大模样。但大模样之后的战斗,李世石在接触的时候处理得有问题。
人类棋手出问题是很正常的,最主要的是他得有一种势力范围的概念,然后才能去想怎么对付电脑。
人类棋手要战胜人工智能,首先要给电脑选择的分支尽量地多,让其意图模糊,同时人类棋手要尽量隐藏自己的意图。职业棋手要改变下棋的思路是非常难的,更难以猜测电脑的思路。电脑的演算能力太强了,这是人脑无法比拟的。
至于打劫,包括多位世界冠军在内的职业选手,在此前都怀疑电脑不会打劫,AlphaGo今天证实拥有这个能力。但这个众所期待的劫争却并不是那么精彩。
白棋第一步主动提劫是在第154手,从打劫的进程看,AlphaGo处理的还是非常完美的,没出现什么失误;李世石在劫争中也没有什么失误,只是这次打劫,对胜负已经没有太大关系。
本文仅代表作者个人观点,不代表《财经》立场
罗洗河:
中国围棋职业九段,1989年定为初段,2002年升为九段,被称为“天才棋手”。2006年1月13日,罗洗河九段执黑5目半战胜韩国李昌镐九段,以2:1的总比分夺得2006年首个世界冠军,这也是李昌镐首次在世界大赛的决赛舞台上首次败给了非本国的棋手。