范江怀/解放军报
——从“阿尔法围棋”战胜世界冠军看人工智能在军事领域的影响
“阿尔法围棋”完胜世界冠军李世石的对弈,成了近日人们关注的焦点。据悉,第一盘棋就有超过一亿人观看了直播。而有关这场人机大战的话题,一时间更是充斥着网上论坛和街头巷尾。
谁是最大的赢家?
AlphaGo 4:1胜李世石,人机围棋大战巅峰对决至此落幕。不过关于人工智能与围棋的故事仍在延续,更多的人机对决,或许不久便将到来。 视觉中国 图
赛前,人们普遍看好世界冠军李世石,尽管他已不在竞技的巅峰状态,毕竟实力还在。但令人没想到的是,李世石如此不堪一击。
电脑战胜了人脑,人们想到了,但没有想到来的这么快。于是,有人担忧甚至是恐惧。当然也有人兴奋:人工智能赢了棋,人类赢得了未来!其理由是:战胜李世石的“阿尔法围棋”是由人研发的。
电脑战胜了人脑,会给人类带来什么样的革命性变化?这不是本文想探讨的话题。人类当然是可以赢得未来,但不等于你就能赢得未来。换句话说,这场人机大战谁是最大的赢家?
是电脑?是“阿尔法围棋”?是谷歌研发团队?是英国人?据悉,研发“阿尔法围棋”的是一家仅有50多人的英国小公司。仅仅是观看了这个小公司的一次演示,谷歌公司就毫不迟疑以4亿英镑的重金收购了这家英国的小公司——这是发生在2013年的事。
仅仅过了两年多的时间,一个具有里程碑意义的事件就发生了:人类4000年的围棋历史,被“阿尔法围棋”改写,开辟了新纪元。
里程碑事件的背后,总会有一个推手。这次人机大战也概莫能外。人机大战之前,笔者在《人机大战,战争最好的预实践?》一文中提到,当年IMB研发战胜国际象棋顶级大师卡斯帕罗夫的“更深的蓝”,就得到了美国国防部的资助。话到此处,谁是此次人机大战最大的赢家,不说大家也“懂得”。
科学技术每一次划时代的进步,都会造福于人类,但也有可能祸害人类。比如火药,比如核能,这关键要看谁在用,用的目的是干什么?
美国康奈尔大学教授、人工智能专家巴特·塞尔曼在谈到“人工智能威胁论”时说,开发人工智能有一定的风险,但人工智能研究界已经开始研究所谓的人工智能安全。这些将要开发出来的系统将对人类保持友好,并与人类合作,我对此相当有信心。除了特定军事应用,开发“敌对人工智能”不符合任何人的利益。
什么是世界强国?站在科技最前沿的国家才能成为世界强国。军队也是如此,你拥有世界最先进的科技,才有可能成为世界一流的军队。所以,抢占高科技的制高点,一直是大国和强国的必修课。
电脑战胜人脑,我们不一定要恐惧,但一定要警惕。
真正的对手在哪儿?
战争(比赛)的胜负不取决于冲在最前面的人,而是取决于后面的团队;不完全取决于打仗(比赛)的过程,而是取决于准备打仗(比赛)的过程。 视觉中国 图
在人机大战前两盘的比赛中,李世石输的嘎嘣脆。韩国媒体就坐不住了,替李世石喊冤,说比赛不公平,称“阿尔法围棋”后面拥有无数个“指教者”。
此话有点强词夺理,但也不无道理。李世石对付的确实不是一个人,而是一支高智商的研发团队。
在这次人机大战之前,体育界的人士大多看好李世石,而科技界的人士却大多看好“阿尔法围棋”。有比较冷静的专业人士就说过,这场人机大战的胜负,其实在开赛之前就已经决定了。这当然没有什么猫腻和君子协定。李世石确实是一个人在战斗。
把赛场和战场对接一下,你就会发现有着惊人的相似之处。
仅举一个最新的战例:美军海豹突击队击毙本·拉登的“海神之矛”行动。从表面上看,冲在最前面的只是24个特种兵,而在他们的后面,有一个庞大的团队:天上有提供信息的卫星,海上有负责接应的航母,陆地有军事基地进行支援,华盛顿有全知的指挥中心……前面有24个人在作战,后面却有24的N次方的人员在帮忙。这样的战斗行动能不取得成功吗?
不管是人机大战也好,“海神之矛”的战斗行动也罢,都在印证着这么一个道理:战争(比赛)的胜负不取决于冲在最前面的人,而是取决于后面的团队;不完全取决于打仗(比赛)的过程,而是取决于准备打仗(比赛)的过程。
如果明白了这么一个道理,1∶4落败的李世石也应该感到释然。
所以,我们说“人机大战是战争最好的预实践”一点也不牵强。这实际上也给我们提出了一个课题,我们的资源和力量是用在培养一个世界冠军上呢,还是用于培养一支有创新能力的研发团队上;是用在一线呢,还是二线甚至三线四线。据悉,谷歌公司只有10%的人负责赚钱,90%的人负责胡思乱想去搞创新,而“阿尔法围棋”就是他们胡思乱想贪玩的结晶。
不管是冷兵器时代,还是机械化时代,在前方打仗靠的是“人海战术”,解决问题需要“集中优势兵力”。信息化战争不再打“人海战术”,大兵团厮杀的场景难于再现,但就整个战争而言,用兵并不见得少,相反有可能还多,只不过是用在最前沿的兵大大减少了,用兵的位置发生了乾坤大挪移。未来战争无人化、网络化和非接触的作战模式,参与者会变得更多,有时你真的不知道对手是谁、藏在哪儿?
我们天天念叨“制胜机理”?想想其实也很简单,就是“把正确的人用在正确的地方”。
当“孙子”还是当“老子”?
据悉,人机大战的第一盘棋就有超过一亿人观看了直播。 视觉中国 图
“阿尔法围棋”能完胜世界冠军,与以往下棋的程序最大的不同,就是它善于学习,而且具备了深度学习的能力。
人类学习的速度和容量,是无法企及电脑的。一个棋手一年只能下1000多盘棋,“阿尔法围棋”一天就能下100万盘棋。“阿尔法围棋”的“脑袋”里装了15万职业棋手的棋谱、上百万业余棋手的棋谱,并且自我对弈了3000万盘棋。人脑装的棋谱,估计连电脑的零头都不到。
赛前,很多人曾戏谑地把人工智能围棋程序称为“阿尔法狗”,当这只“狗”在前三盘完胜李世石之后,很多人便立马改口称“阿尔法老师”了。从学习能力上来说,电脑在一些方面已经远超人脑,“阿尔法围棋”战胜世界冠军也没有什么可奇怪的。
在互联网上流传这么一句名言: 研究兵法最多成为“孙子”,无为而治却能成为“老子”。
我们跟着李世石学围棋,最多只能成为一时的世界冠军;但如果能像“阿尔法围棋”那样拥有强大的学习能力,能博采众长地学习所有世界冠军的经验和长处,那就能成为高处不胜寒的顶尖高手。
赛场和战场虽然有不同的运行法则,但制胜机理很多则是相通的。比如学习。
人类虽然不可能具备电脑的某些学习能力,但以计算机为核心的信息技术,为人类的学习创造了优越的学习条件和无限可能。过去,我们只能在战争中学习战争,现在可以在电脑模拟的近似实战环境下学习战争,推演未来战争的攻防模式和发展趋势。科学家们现在在教会电脑如何学习,今后我们将在擅长学习的电脑帮助下拓展我们的学习。
当然,我们也必须看到,战场上的学习和赛场上的学习又有很多不同。“阿尔法围棋”可以轻而易举地获得众多围棋高手的棋谱,可在军事层面上,你想要获得对手训练、演习乃至作战方面的相关数据,难上加难!军事领域的学习一定程度上是在“摸着石头学习”。
一位金融家曾经深有感触地说,财富不是最重要的,时间才是,学习才是。
怎么学,跟谁学,学什么,这是一个问题。在信息化的时代,最紧迫的任务就是学会如何学习。因为,学习能力决定了创新能力,创新能力则决定了一个人或者一个团队的实力——这应该是人机大战给我们最大的启迪。
人机如何融合?
人机大战结束后,不少业内人士都在分析电脑和人脑下棋的优劣长短。
说到“阿尔法围棋”的长处,中国围棋等级分第一人柯洁在看了比赛后就直言,“阿尔法围棋”“能分清大小,这点非常厉害”。具备了在下棋时进行价值判断的能力,这是“阿尔法围棋”此次能够战胜李世石的一个重要因素。
电脑的长处是显而易见的:学习能力强大、计算能力强大、记忆能力强大,而且行事不会受到情绪影响,不会犯错。但电脑和人比,缺乏的是想象力和创造力,没有好恶是非的观念和喜怒哀乐的情感。
人机大战尚未结束,就有人说用“阿尔法围棋”的技术用来炒股、用来看病,肯定也能“大获全胜”。事实是,人工智能技术在很多领域已经开始发挥作用,但绝不是像人们想象的那么简单。人在电脑的帮助下会变得更加强大,但电脑失去了人的支持,很难有所作为。这实际上带来的是一个大家一直在探索的问题:人机如何取长补短融合成一体?
在现实社会中,我们已经离不开电脑了,信息技术无处不在。但不可否认,这只是一个“人机交互”的时代。人类要跨入“人机融合”的最高境界,一方面,人工智能技术需要再上一个台阶,另一方面,人类自己则需要强化“人机合一”的意识而非恐惧的担忧。在“阿尔法围棋”战胜世界围棋冠军后,人们在“人机融合”方面变得更为迫切。在金融、医疗、体育领域如此,在军事领域更是如此。
若干年前,美军就致力于用巴顿的战术与盖茨的技术有机地结合,帮助指挥官去寻找战场取胜的方法和手段。在纯技术层面上,美国在新世纪之初就开始探讨“脑机接口”技术军事应用,投入巨资研究武器与人相互作用机理,研发能驰骋未来战场的“机器战士”。
未来战争是在信息体系支撑下进行的,只有解决好人机融合这一核心问题,才能占据着战场的主动,赢得现代战争最后的胜利。
最大的挑战在人机融合,最大的机遇也在人机融合。对照人机大战这面镜子,我们的指战员在人机融合方面做得还远远不够。