釋放大師級國際象棋 AI:一種突破性的方法

發現這個突破性的 AI 系統,可以在沒有搜索或自我遊戲的情況下,以大師級水平下棋。這個小巧高效的模型從 Stockfish 學習,並超越了龐大的語言模型,暗示著未來 AI 可以生成可解釋的算法。探索這種革命性的影響,涉及自動駕駛汽車和光線追蹤等領域。

2025年2月24日

party-gif

DeepMind 最新的人工智慧突破展示了其在不依賴傳統技術如搜索和自我遊戲的情況下達到大師級國際象棋水平的能力。這一非凡的成就展示了基於變換器的神經網絡學習複雜技能的能力,只需觀察專家行為即可,為超越國際象棋領域,如自動駕駛汽車和光線追蹤算法等領域的進步鋪平了道路。

無搜索和自我對弈的大師級國際象棋 AI

谷歌DeepMind的研究人员开发了一种全新的基于AI的国际象棋系统,可以达到grandmaster级别的水平,而不依赖于传统的搜索和自我对弈技术。相反,这个系统通过分析150亿个棋局状态和Stockfish(一个强大的手工制作的国际象棋引擎)做出的相应走法,从中学习。

所得到的模型非常高效,只有2.7亿个参数,比GPT-4小约3000倍。尽管体积很小,但该模型在配备200美元显卡的个人电脑上每秒可以生成20个走法,在标准CPU上每秒可以生成2个走法。这种性能远远优于体积大3000倍的GPT-4在国际象棋方面的表现。

有趣的是,这个系统运行在两个可能看起来违反直觉的关键假设之上。首先,它只接受单一的棋局状态作为输入,而不是一系列棋局位置。其次,它只看一步ahead,选择获胜概率最高的走法。这些假设可能不会导致最强大的国际象棋引擎,但这是有意为之的,因为这项工作的主要目标不是创造最强大的国际象棋AI,而是证明基于transformer的神经网络可以通过简单地观察专家的行为来学习专业知识。

这一成就很重要,因为它代表了创造可以学习逼近算法而不仅仅提供答案的AI系统的一步。研究人员将其与之前的神经程序员解释器工作联系起来,后者旨在创造可以生成可读程序的AI。同样地,这个国际象棋系统有潜力揭示其神经网络中的潜在国际象棋算法,这可能对开发能够为诸如自动驾驶汽车、光线追踪等任务创造有用算法的AI产生更广泛的影响。

常問問題