天津在线

首页> 科技频道> 互联网> 正文

美媒:阿尔法围棋获胜诠释深层学习威力

核心提示:为了弄清这些棋局中蕴含的决胜策略,系统使用了一种名为“深层学习”的超凡方法,能够梳理出模式并一下抓住重点,而不会迷失在信息海洋中。

参考消息网3月19日报道 美媒称,“阿尔法围棋”这个由谷歌旗下“深层思维”公司创建的人工智能系统,在人机围棋大赛中以四比一的成绩击败了围棋冠军李世石。这场人机大赛究竟重要在哪里?毕竟1997年国际象棋冠军加里·卡斯帕罗夫就败在了国际商用机器公司的“深蓝”计算机手下。那么为何说“阿尔法围棋”的胜利具有特别重要的意义呢?

据美国《纽约时报》网站3月16日文章称,和国际象棋一样,围棋是高度复杂的战略游戏,无法依靠机会和运气取胜。然而和象棋不同的是,没人能解释高段位围棋该如何下。事实上,甚至连围棋大师都无法完全搞懂自己为什么会下得一手好棋。从驾车到辨认面孔,这种不自知是存在于人类诸多能力中的一种普遍现象。英国哲学家、科学家迈克尔·波拉尼描绘这种奇异的状态时说:“我们知道的要比我们能表达的多。”人们将这种现象称为“波拉尼的悖论”。

文章称,“波拉尼的悖论”并没有妨碍人民使用电脑来完成一些复杂工作。这些活动的编程需要极高的精确度,以命令电脑具体该做什么。而给电脑编程的老方法在应用方面非常受限,在很多领域都行不通。

“深蓝”之所以能够有超人的绝佳表现,几乎纯粹是靠运算能力:它被输入了数百万个国际象棋案例,因此能在众多可能性中进行筛选,从而确定下一步棋的最佳位置。然而围棋落子的可能性要多得多,即便是运算速度最快的电脑都无法模拟哪怕其中一小部分。

文章称,“阿尔法围棋”生动地诠释了新方法的威力。这个方法是创建一个几乎完全靠自学,并通过观察成功与失败案例来掌握得胜技巧的系统。

“阿尔法围棋”确实使用了模拟的方式和传统搜索算法来帮它下了几步棋,但真正的突破则在于它能够克服“波拉尼的悖论”。之所以能做到这点,是因为它既能通过具体案例,也能通过自身经验来得出决胜战略。这些案例取材于2500年围棋史上出自围棋大师之手的无数经典棋局。为了弄清这些棋局中蕴含的决胜策略,系统使用了一种名为“深层学习”的超凡方法,能够梳理出模式并一下抓住重点,而不会迷失在信息海洋中。

文章称,对于人脑来说,学习是一个在神经元之间形成并加强关联的过程。“深层学习”系统采取了类似方式,因而被称作“神经网络”。它在软件中建立起数十亿节点和关联,使用案例“训练集”来强化刺激(正在下的棋)和反应(下一步棋)间的关联,而后再对系统进行新刺激,并观察其反应。通过另一种名叫“强化学习”的技术,“阿尔法围棋”还和自己下了数百万盘棋,以记住有效走法和战略。

“深层学习”和“强化学习”并非新生事物,然而直到最近,我们才认清其威力以及其所能到达的境地。

文章称,虽然还有很长的路要走,但其意义深远。未来数年内,技术带来的变革将会波及人类经济。了解并解决科技迅速发展所带来的社会挑战仍是人类所面临的任务,没有机器能够替代我们完成。

版权声明

一、凡注明来源为"天津在线"的所有作品文字、图片、音视频、美术设计和程序等作品,版权均属天津在线或相关权利人专属所有或持有所有。

二、未经本网书面授权,不得进行一切形式的下载、转载或建立镜像。否则以侵权论,依法追究相关法律责任。

三、凡本网注明"来源:XXX(非天津在线)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

四、转载声明:如本网转载作品涉及版权等问题,请在作品于本网发表之日起30日内及时同本网联系,否则视为放弃相关权利。

免责声明:本文仅代表作者个人观点,与天津在线无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

登载此文只为提供信息参考,并不用于任何商业目的。如有侵权,请及时联系我们删除:jubao@72177.com

今日天津