军报刊文：围棋人机大战是战争预实践

范江怀/解放军报

——从“阿尔法围棋”战胜世界冠军看人工智能在军事领域的影响

“阿尔法围棋”完胜世界冠军李世石的对弈，成了近日人们关注的焦点。据悉，第一盘棋就有超过一亿人观看了直播。而有关这场人机大战的话题，一时间更是充斥着网上论坛和街头巷尾。

谁是最大的赢家？

AlphaGo 4:1胜李世石，人机围棋大战巅峰对决至此落幕。不过关于人工智能与围棋的故事仍在延续，更多的人机对决，或许不久便将到来。视觉中国图

赛前，人们普遍看好世界冠军李世石，尽管他已不在竞技的巅峰状态，毕竟实力还在。但令人没想到的是，李世石如此不堪一击。

电脑战胜了人脑，人们想到了，但没有想到来的这么快。于是，有人担忧甚至是恐惧。当然也有人兴奋：人工智能赢了棋，人类赢得了未来！其理由是：战胜李世石的“阿尔法围棋”是由人研发的。

电脑战胜了人脑，会给人类带来什么样的革命性变化？这不是本文想探讨的话题。人类当然是可以赢得未来，但不等于你就能赢得未来。换句话说，这场人机大战谁是最大的赢家？

是电脑？是“阿尔法围棋”？是谷歌研发团队？是英国人？据悉，研发“阿尔法围棋”的是一家仅有50多人的英国小公司。仅仅是观看了这个小公司的一次演示，谷歌公司就毫不迟疑以4亿英镑的重金收购了这家英国的小公司——这是发生在2013年的事。

仅仅过了两年多的时间，一个具有里程碑意义的事件就发生了：人类4000年的围棋历史，被“阿尔法围棋”改写，开辟了新纪元。

里程碑事件的背后，总会有一个推手。这次人机大战也概莫能外。人机大战之前，笔者在《人机大战，战争最好的预实践？》一文中提到，当年IMB研发战胜国际象棋顶级大师卡斯帕罗夫的“更深的蓝”，就得到了美国国防部的资助。话到此处，谁是此次人机大战最大的赢家，不说大家也“懂得”。

科学技术每一次划时代的进步，都会造福于人类，但也有可能祸害人类。比如火药，比如核能，这关键要看谁在用，用的目的是干什么？

美国康奈尔大学教授、人工智能专家巴特·塞尔曼在谈到“人工智能威胁论”时说，开发人工智能有一定的风险，但人工智能研究界已经开始研究所谓的人工智能安全。这些将要开发出来的系统将对人类保持友好，并与人类合作，我对此相当有信心。除了特定军事应用，开发“敌对人工智能”不符合任何人的利益。

什么是世界强国？站在科技最前沿的国家才能成为世界强国。军队也是如此，你拥有世界最先进的科技，才有可能成为世界一流的军队。所以，抢占高科技的制高点，一直是大国和强国的必修课。

电脑战胜人脑，我们不一定要恐惧，但一定要警惕。

真正的对手在哪儿？

战争（比赛）的胜负不取决于冲在最前面的人，而是取决于后面的团队；不完全取决于打仗（比赛）的过程，而是取决于准备打仗（比赛）的过程。视觉中国图

在人机大战前两盘的比赛中，李世石输的嘎嘣脆。韩国媒体就坐不住了，替李世石喊冤，说比赛不公平，称“阿尔法围棋”后面拥有无数个“指教者”。

此话有点强词夺理，但也不无道理。李世石对付的确实不是一个人，而是一支高智商的研发团队。

在这次人机大战之前，体育界的人士大多看好李世石，而科技界的人士却大多看好“阿尔法围棋”。有比较冷静的专业人士就说过，这场人机大战的胜负，其实在开赛之前就已经决定了。这当然没有什么猫腻和君子协定。李世石确实是一个人在战斗。

把赛场和战场对接一下，你就会发现有着惊人的相似之处。

仅举一个最新的战例：美军海豹突击队击毙本·拉登的“海神之矛”行动。从表面上看，冲在最前面的只是24个特种兵，而在他们的后面，有一个庞大的团队：天上有提供信息的卫星，海上有负责接应的航母，陆地有军事基地进行支援，华盛顿有全知的指挥中心……前面有24个人在作战，后面却有24的N次方的人员在帮忙。这样的战斗行动能不取得成功吗？

不管是人机大战也好，“海神之矛”的战斗行动也罢，都在印证着这么一个道理：战争（比赛）的胜负不取决于冲在最前面的人，而是取决于后面的团队；不完全取决于打仗（比赛）的过程，而是取决于准备打仗（比赛）的过程。

如果明白了这么一个道理，1∶4落败的李世石也应该感到释然。

所以，我们说“人机大战是战争最好的预实践”一点也不牵强。这实际上也给我们提出了一个课题，我们的资源和力量是用在培养一个世界冠军上呢，还是用于培养一支有创新能力的研发团队上；是用在一线呢，还是二线甚至三线四线。据悉，谷歌公司只有10%的人负责赚钱，90%的人负责胡思乱想去搞创新，而“阿尔法围棋”就是他们胡思乱想贪玩的结晶。

不管是冷兵器时代，还是机械化时代，在前方打仗靠的是“人海战术”，解决问题需要“集中优势兵力”。信息化战争不再打“人海战术”，大兵团厮杀的场景难于再现，但就整个战争而言，用兵并不见得少，相反有可能还多，只不过是用在最前沿的兵大大减少了，用兵的位置发生了乾坤大挪移。未来战争无人化、网络化和非接触的作战模式，参与者会变得更多，有时你真的不知道对手是谁、藏在哪儿？

我们天天念叨“制胜机理”？想想其实也很简单，就是“把正确的人用在正确的地方”。

当“孙子”还是当“老子”？

据悉，人机大战的第一盘棋就有超过一亿人观看了直播。视觉中国图

“阿尔法围棋”能完胜世界冠军，与以往下棋的程序最大的不同，就是它善于学习，而且具备了深度学习的能力。

人类学习的速度和容量，是无法企及电脑的。一个棋手一年只能下1000多盘棋，“阿尔法围棋”一天就能下100万盘棋。“阿尔法围棋”的“脑袋”里装了15万职业棋手的棋谱、上百万业余棋手的棋谱，并且自我对弈了3000万盘棋。人脑装的棋谱，估计连电脑的零头都不到。

赛前，很多人曾戏谑地把人工智能围棋程序称为“阿尔法狗”，当这只“狗”在前三盘完胜李世石之后，很多人便立马改口称“阿尔法老师”了。从学习能力上来说，电脑在一些方面已经远超人脑，“阿尔法围棋”战胜世界冠军也没有什么可奇怪的。

在互联网上流传这么一句名言：研究兵法最多成为“孙子”，无为而治却能成为“老子”。

我们跟着李世石学围棋，最多只能成为一时的世界冠军；但如果能像“阿尔法围棋”那样拥有强大的学习能力，能博采众长地学习所有世界冠军的经验和长处，那就能成为高处不胜寒的顶尖高手。

赛场和战场虽然有不同的运行法则，但制胜机理很多则是相通的。比如学习。

人类虽然不可能具备电脑的某些学习能力，但以计算机为核心的信息技术，为人类的学习创造了优越的学习条件和无限可能。过去，我们只能在战争中学习战争，现在可以在电脑模拟的近似实战环境下学习战争，推演未来战争的攻防模式和发展趋势。科学家们现在在教会电脑如何学习，今后我们将在擅长学习的电脑帮助下拓展我们的学习。

当然，我们也必须看到，战场上的学习和赛场上的学习又有很多不同。“阿尔法围棋”可以轻而易举地获得众多围棋高手的棋谱，可在军事层面上，你想要获得对手训练、演习乃至作战方面的相关数据，难上加难！军事领域的学习一定程度上是在“摸着石头学习”。

一位金融家曾经深有感触地说，财富不是最重要的，时间才是，学习才是。

怎么学，跟谁学，学什么，这是一个问题。在信息化的时代，最紧迫的任务就是学会如何学习。因为，学习能力决定了创新能力，创新能力则决定了一个人或者一个团队的实力——这应该是人机大战给我们最大的启迪。

人机如何融合？

人机大战结束后，不少业内人士都在分析电脑和人脑下棋的优劣长短。

说到“阿尔法围棋”的长处，中国围棋等级分第一人柯洁在看了比赛后就直言，“阿尔法围棋”“能分清大小，这点非常厉害”。具备了在下棋时进行价值判断的能力，这是“阿尔法围棋”此次能够战胜李世石的一个重要因素。

电脑的长处是显而易见的：学习能力强大、计算能力强大、记忆能力强大，而且行事不会受到情绪影响，不会犯错。但电脑和人比，缺乏的是想象力和创造力，没有好恶是非的观念和喜怒哀乐的情感。

人机大战尚未结束，就有人说用“阿尔法围棋”的技术用来炒股、用来看病，肯定也能“大获全胜”。事实是，人工智能技术在很多领域已经开始发挥作用，但绝不是像人们想象的那么简单。人在电脑的帮助下会变得更加强大，但电脑失去了人的支持，很难有所作为。这实际上带来的是一个大家一直在探索的问题：人机如何取长补短融合成一体？

在现实社会中，我们已经离不开电脑了，信息技术无处不在。但不可否认，这只是一个“人机交互”的时代。人类要跨入“人机融合”的最高境界，一方面，人工智能技术需要再上一个台阶，另一方面，人类自己则需要强化“人机合一”的意识而非恐惧的担忧。在“阿尔法围棋”战胜世界围棋冠军后，人们在“人机融合”方面变得更为迫切。在金融、医疗、体育领域如此，在军事领域更是如此。

若干年前，美军就致力于用巴顿的战术与盖茨的技术有机地结合，帮助指挥官去寻找战场取胜的方法和手段。在纯技术层面上，美国在新世纪之初就开始探讨“脑机接口”技术军事应用，投入巨资研究武器与人相互作用机理，研发能驰骋未来战场的“机器战士”。

未来战争是在信息体系支撑下进行的，只有解决好人机融合这一核心问题，才能占据着战场的主动，赢得现代战争最后的胜利。

最大的挑战在人机融合，最大的机遇也在人机融合。对照人机大战这面镜子，我们的指战员在人机融合方面做得还远远不够。

军报刊文：围棋人机大战是战争预实践

相关阅读

版权与免责声明