释放大师级国际象棋 AI:一种突破性的方法

发现这个突破性的人工智能系统,它可以在没有搜索或自我游戏的情况下以大师级水平下国际象棋。这个小巧高效的模型从Stockfish中学习,并超越了庞大的语言模型,暗示着一个未来,人工智能可以生成可解释的算法。探索这种革命性的影响,涉及领域如自动驾驶汽车和光线追踪。

2025年2月14日

party-gif

DeepMind最新的人工智能突破展示了其在不依赖于传统的搜索和自我游戏技术的情况下实现国际象棋大师级水平的能力。这一非凡的成就展示了基于变换器的神经网络通过简单地观察专家行为来学习复杂技能的强大潜力,为超越国际象棋领域,如自动驾驶汽车和光线追踪算法等领域的进步铺平了道路。

无需搜索和自我训练的大师级国际象棋 AI

谷歌DeepMind的研究人员开发了一种全新的基于AI的国际象棋系统,可以达到grandmaster级别的水平,而不依赖于传统的搜索和自我对弈技术。相反,这个系统通过分析150亿个棋局状态和Stockfish(一个强大的手工制作的国际象棋引擎)做出的相应走法,从中学习。

所得到的模型非常高效,只有2.7亿个参数,比GPT-4小约3000倍。尽管体积很小,但该模型在配备200美元显卡的个人电脑上每秒可以生成20个走法,在标准CPU上每秒可以生成2个走法。这种性能远远优于体积大3000倍的GPT-4在国际象棋方面的表现。

有趣的是,这个系统运行在两个可能看起来违反直觉的关键假设之上。首先,它只接受单一的棋局状态作为输入,而不是一系列棋局位置。其次,它只看一步ahead,选择获胜概率最高的走法。这些假设可能不会产生最强大的国际象棋引擎,但这是有意为之的,因为这项工作的主要目标不是创造最强大的国际象棋AI,而是证明基于transformer的神经网络可以通过简单地观察专家的行为来学习专业知识。

这一成就很重要,因为它代表了创造可以学习逼近算法而不仅仅提供答案的AI系统的一步。研究人员将其与之前的神经程序员解释器工作联系起来,后者旨在创造可以生成可读程序的AI。同样地,这个国际象棋系统有潜力揭示其神经网络中的潜在国际象棋算法,这可能对开发能够为诸如自动驾驶汽车、光线追踪等任务创造有用算法的AI产生更广泛的影响。

FAQ