DeepMinds nya AI spelar en mängd 3D-datorspel

DeepMinds nya AI kan spela en mängd moderna 3D-datorspel, till skillnad från tidigare AI:er som specialiserat sig på ett enda spel. Detta visar på imponerande framsteg i AI:s förmåga att förstå komplexa 3D-miljöer och överträffa specialiserade agenter.

19 februari 2025

party-gif

Upptäck hur DeepMinds senaste AI kan utmärka sig i en mängd moderna 3D-datorspel, vilket visar dess förmåga att förstå och navigera i komplexa virtuella miljöer. Denna banbrytande teknik banar väg för AI-system som kan hjälpa oss med en bred uppsättning utmaningar i den verkliga världen.

Upptäck kraften i en AI som behärskar ett brett utbud av 3D-spel

Detta AI-system från DeepMind representerar ett betydande genombrott inom området för spel-AI. Till skillnad från tidigare system som var anpassade till specifika spel, kan denna AI spela en bred uppsättning moderna 3D-spel effektivt.

Den viktiga innovationen är att AI:n inte förlitar sig på spel-specifika data eller koordinater, utan istället bearbetar den råa visuella ingången från spelskärmen, precis som en mänsklig spelare skulle göra. Detta gör att AI:n kan förstå den 3D-spelvärlden och hur den förändras över tid, en bedrift som tidigare ansågs otroligt svår för ett AI-system.

Anmärkningsvärt nog presterar AI:n inte bara väl i enskilda spel, utan visar också förmågan att överföra kunskap som förvärvats genom att spela flera spel, och överträffar specialiserade agenter som tränats på ett enda spel under lång tid. Detta visar på AI:ns kapacitet för inlärning och tillämpning av kunskap över olika domäner, ett kännetecken på intelligens.

Även om den nuvarande prestandan ännu inte når upp till mänsklig nivå, är resultaten mycket lovande och tyder på att med ytterligare förfining kan detta AI-system bana väg för utvecklingen av mångsidiga AI-agenter som kan assistera människor i ett brett utbud av 3D-baserade uppgifter och utmaningar.

Hur denna AI spelar spel som en människa, ser världen genom pixlar

Detta AI-system från DeepMind är ett betydande framsteg inom området för AI-spelande. Till skillnad från tidigare AI-agenter som var anpassade till specifika spel, kan denna AI spela en mängd moderna 3D-spel effektivt. Den avgörande skillnaden är att denna AI inte förlitar sig på spel-specifika data som koordinater eller poäng. Istället bearbetar den spelvärlden direkt genom pixlarna på skärmen, precis som en mänsklig spelare skulle göra.

Denna förmåga att förstå den 3D-spelvärlden från en 2D-pixelrepresentation är otroligt imponerande, särskilt för komplexa 3D-spel. AI:n kan uppfatta spelomgivningen, spåra förändringar över tid och kontrollera spelet med hjälp av tangentbord och mus, allt utan tillgång till de underliggande speldata.

Förutom det, förbättras AI:ns prestanda när den tränas på flera spel, snarare än bara ett. Detta visar på en nivå av generalisering och överföring av kunskap som är ett kännetecken på mänsklig-liknande intelligens. AI:n kan tillämpa insikter som förvärvats från ett spel för att förbättra sin prestanda i andra spel.

Men även om den nuvarande framgångsgraden ännu inte når upp till mänsklig nivå, är potentialen för ytterligare framsteg tydlig. Forskarna planerar att utforska AI:ns förmåga att engagera sig i mer långsiktig strategisk planering, som att hitta resurser och bygga en lägerplats i ett strategispel. Detta representerar nästa steg i att skapa AI-system som verkligen kan förstå och assistera människor i ett brett utbud av 3D-uppgifter.

Den överraskande fördelen med att spela flera spel: Förbättrad prestanda

Studien avslöjar ett överraskande fynd - efter att AI-agenten tränats på flera spel, kunde den prestera bättre på varje enskilt spel jämfört med en specialiserad agent som enbart tränats på det spelet. Detta tyder på att förmågan att lära sig och tillämpa kunskap över olika domäner, ett kännetecken på mänsklig intelligens, även kan gynna prestandan hos AI-system i komplexa 3D-datorspel.

Baslinjeprestandan för den specialiserade agenten, som tränats intensivt på ett enda spel, överträffades av agenten som exponerats för en mängd olika spel, även på den specialiserade agentens eget spel. Detta demonstrerar kraften i kunskapsöverföring mellan domäner, där AI:n kan extrahera och tillämpa generella principer och strategier som är tillämpliga i olika spelvärldar.

Detta fynd utmanar den traditionella uppfattningen om AI-system som snävt specialiserade och begränsade till de specifika uppgifter de tränats på. Istället pekar det på potentialen för mer flexibla och anpassningsbara AI-agenter som kan dra nytta av sina erfarenheter inom ett område för att förbättra sina förmågor inom ett annat. Detta är ett betydande steg mot målet att skapa AI-system som kan förstå och assistera människor i ett brett utbud av utmanande uppgifter i den 3D-värld vi lever i.

Begränsningar och utrymme för tillväxt: Vad är nästa steg för denna banbrytande AI?

Men även om prestandan hos detta nya AI-system är imponerande, är den ännu inte på mänsklig nivå. Framgångsgraden, även om den är rimlig för ett första försök, lämnar utrymme för förbättring. Även människor uppnår inte 100% på dessa komplexa 3D-speluppgifter, så det finns gott om möjligheter för AI:n att växa och förfina sina förmågor.

En nyckelbegränsning är längden på de sekvenser som AI:n kan hantera, som för närvarande är begränsad till 10 sekunder. Detta begränsar dess förmåga att engagera sig i mer intensiv, långsiktig strategisk planering, som att hitta resurser och bygga en lägerplats i ett strategispel. Att övervinna denna begränsning kommer sannolikt att vara ett fokus för framtida forskning på detta system.

Trots dessa nuvarande begränsningar är författaren optimistisk när det gäller potentialen för stegvisa förbättringar att leda till något verkligt speciellt. Förmågan hos AI:n att lära sig från att spela flera spel och överträffa specialister på deras egna spel är ett lovande tecken på dess anpassningsförmåga och potential för tillväxt.

Som författaren påpekar handlar det inte bara om att spela datorspel, utan snarare ett steg mot att skapa AI-agenter som kan förstå och assistera människor i ett brett utbud av utmanande 3D-uppgifter. Författaren ser med spänning fram emot att se vad DeepMind-teamet kommer att avslöja härnäst och ser fram emot att dela fler insikter med publiken så snart som möjligt.

Den större visionen: Tillämpa AI för att förstå och hjälpa människor i den verkliga världen

Målet med DeepMinds nya AI-system är inte bara att utmärka sig i att spela en mängd moderna 3D-datorspel, utan att skapa AI-agenter som kan förstå och assistera människor i ett brett utbud av utmanande verkliga uppgifter. Genom att lära sig uppfatta spelvärlden genom skärmens pixlar och interagera med den med hjälp av tangentbord och mus, visar AI:n en förmåga att förstå och navigera i komplexa 3D-miljöer, precis som en människa skulle göra.

Denna förmåga är ett betydande steg mot det slutgiltiga målet att utveckla AI-system som kan förstå och samarbeta med människor i den verkliga världen. Forskarna strävar efter att utnyttja den kunskap och de färdigheter som förvärvats genom denna behärskning av datorspel för att skapa agenter som kan assistera människor i olika uppgifter, från strategisk planering till resurshantering och därutöver.

Men även om den nuvarande prestandan hos AI:n ännu inte når upp till mänsklig nivå, är forskarna övertygade om att genom stegvisa förbättringar kan de göra framsteg mot verkligt anmärkningsvärda förmågor. Nyckeln är att fokusera inte på de nuvarande begränsningarna, utan på potentialen för framtida framsteg, i enlighet med den första lagen om artiklar.

Genom att fortsätta att utmana gränserna för vad AI kan uppnå, banar forskarna på DeepMind väg för en framtid där AI-system kan smälta in med och stödja mänskliga strävanden, vilket i slutändan förbättrar vår förmåga att navigera och frodas i den komplexa 3D-värld vi lever i.

FAQ