Från OpenAI-myteri till säker AGI: Ilia Suks nya AI-företag
Utforska de senaste nyheterna inom AI, inklusive Ilia Suks nya företag, Elon Musks AI-servergård och framsteg inom säker AGI, multimodal AI och $1M AGI-priset. Dyk in i de banbrytande utvecklingarna som formar framtiden för artificiell intelligens.
24 februari 2025

Upptäck de senaste framstegen inom AI-världen, från lanseringen av Ilia Suks nya företag som fokuserar på säker superintelligens, till Elon Musks enorma AI-servergård, framväxten av QAR och de spännande nya lanseringarna från Meta AI. Håll dig uppdaterad och lär dig om de banbrytande innovationer som formar framtiden för artificiell intelligens.
Ilia Suk lanserar det nya företaget 'Safe Super Intelligence Inc' för att sträva efter säker superintelligens
Elon Musk och Michael Dell bygger en massiv AI-serverpark
Framväxten av den potentiella 'Q*'-algoritmen och dess imponerande prestanda
Meta AI:s senaste lanseringar: Meta Chameleon, Multi-Token Prediction och Text-to-Music-modeller
Anthropic släpper Claude 3.5 Sonet, deras hittills mest intelligenta modell
AGI-priset på 1 miljon dollar: En tävling för att uppnå artificiell allmän intelligens
Ilia Suk lanserar det nya företaget 'Safe Super Intelligence Inc' för att sträva efter säker superintelligens
Ilia Suk lanserar det nya företaget 'Safe Super Intelligence Inc' för att sträva efter säker superintelligens
Ilia Suk, den tidigare anställda på Open AI som försökte starta ett myteri mot Sam Altman, har lanserat ett nytt företag som heter "Safe Super Intelligence Inc." Företaget är dedikerat till att sträva efter säker superintelligens, vilket Suk anser vara det viktigaste tekniska problemet i vår tid.
Suk har samlat ett team av erfarna ingenjörer och forskare, inklusive medgrundarna Daniel Gross och Daniel Levy, för att arbeta mot detta mål. Företagets uppdrag är att snabbt öka kapaciteten samtidigt som säkerheten förblir i fokus, i kontrast till Suks farhågor om Open AIs prioriteringar.
Safe Super Intelligence Inc. tar en "rakt på sak"-approach, med ett enda fokus och produkt. Företaget är baserat i USA med kontor i Palo Alto och Tel Aviv, vilket gör det möjligt att rekrytera topptalanger inom teknik. Suk betonar att företagets affärsmodell, investerare och hela produktväg är inriktade på att uppnå säker superintelligens, utan distraktioner från ledningsarbete eller produktcykler.
Elon Musk och Michael Dell bygger en massiv AI-serverpark
Elon Musk och Michael Dell bygger en massiv AI-serverpark
Elon Musk och Tesla bygger en enorm serverpark med hjälp av både Dell och Nvidia. Denna serverpark är utformad för att driva stora språkmodeller och AI-system.
Projektet antyddes först för några månader sedan, med en bild som visade skalan på kylsystemet som krävs för detta enorma åtagande. Igår bekräftade Michael Dell, grundaren av Dell, att de "bygger en Dell AI-fabrik tillsammans med Nvidia för att driva GPT för XAI".
Serverparken ligger i Texas, där det varma klimatet kräver ett robust kylsystem. Bilder visar den enorma storleken på fläktarna som installeras för att hålla servrarna svala.
Detta samarbete mellan Elon Musk, Michael Dell och Nvidia belyser de betydande investeringar och den infrastruktur som krävs för att stödja utvecklingen av avancerade AI-system. Genom att bygga denna enorma serverpark positionerar de sig för att driva nästa generation av stora språkmodeller och AI-tillämpningar.
Framväxten av den potentiella 'Q*'-algoritmen och dess imponerande prestanda
Framväxten av den potentiella 'Q*'-algoritmen och dess imponerande prestanda
Forskningsrapporten som nyligen publicerades verkar introducera en implementering av en teknik som liknar Q*, en kraftfull algoritm som kombinerar Monte Carlo-trädsökning och djupinlärning. Detta tillvägagångssätt gör det möjligt för agenter att lära sig beslutsfattande och resonemang genom en process av försök och misstag, precis som hur människor lär sig.
Den viktigaste innovationen är användningen av MCTS (Monte Carlo-trädsökning) och självförfining, vilket gör det möjligt för modellen att planera framåt, prova olika alternativ och lära sig av sina misstag. Detta är en betydande förbättring jämfört med traditionella språkmodeller som enbart förlitar sig på att förutsäga nästa ord.
Resultaten är imponerande, där modellen uppnår 96,66% noggrannhet på en matematisk benchmark, vilket överträffar till och med stora språkmodeller som GPT-4 och Gemini, samtidigt som den använder 200 gånger färre parametrar. Detta visar kraften i att kombinera planering, resonemang och inlärning i ett enda ramverk.
Förmågan att planera, experimentera och förfina sin approach är ett avgörande steg mot en mer generell intelligens. Allt eftersom vi fortsätter att se genombrott inom områden som detta blir vägen mot artificiell allmän intelligens (AGI) alltmer påtaglig.
Meta AI:s senaste lanseringar: Meta Chameleon, Multi-Token Prediction och Text-to-Music-modeller
Meta AI:s senaste lanseringar: Meta Chameleon, Multi-Token Prediction och Text-to-Music-modeller
Meta AI har nyligen släppt flera spännande nya modeller och teknologier:
-
Meta Chameleon: En språkmodell med 7 miljarder och 34 miljarder parametrar som stöder blandade modaliteter och text-på-utdata. Denna modell kan hantera multimodala indata på ett naturligt sätt, till skillnad från tidigare öppna källkodmodeller som krävde tillägg. Den är för närvarande endast tillgänglig under en forskningslicens, men denna teknik är ett betydande steg framåt för multimodala AI-funktioner.
-
Förutsägelse av flera token: Meta har föreslagit en ny approach för språkmodellering som förutsäger flera framtida ord samtidigt, istället för den traditionella metoden att förutsäga ett ord i taget. Detta förbättrar modellens funktioner och träningseffektivitet, samtidigt som det möjliggör snabbare hastigheter. Meta släpper förtränade modeller för kodkomplettering under en icke-kommersiell forskningslicens.
-
Generativa text-till-musik-modeller: Meta har utvecklat modeller som kan generera musik från textindata, med olika villkorande indata för större kontroll. Den förtränade modellen och inferenskoden kommer att släppas senare denna månad under en MIT-licens, vilket gör det möjligt för forskare att utforska denna spännande nya förmåga.
Dessa lanseringar visar på Metas fortsatta framsteg inom multimodal AI, språkmodellering och generativa funktioner. Öppenkällkoden för dessa modeller och teknologier kommer att möjliggöra ytterligare forskning och utveckling inom dessa områden, vilket driver framsteg inom artificiell intelligens.
Anthropic släpper Claude 3.5 Sonet, deras hittills mest intelligenta modell
Anthropic släpper Claude 3.5 Sonet, deras hittills mest intelligenta modell
Antropic har just släppt en ny version av deras Claude-språkmodell, kallad Claude 3.5 Sonet. Enligt tillkännagivandet är detta deras "mest intelligenta modell hittills" och den första versionen i deras 3.5-modellserie.
De viktigaste höjdpunkterna i Claude 3.5 Sonet inkluderar:
-
Den överträffar konkurrentmodeller i nyckelutvärderingar, inklusive GSM 8K (96,4%), examensnivå-resonemang (60%) och kod (92%) - allt detta med dubbla hastigheten jämfört med Claude 3 och Opus, och till en tiondel av kostnaden.
-
Den överträffar Claude 3 Opus på alla standardvisionsbenchmarks, vilket gör den till Anthropics starkaste visionmodell hittills.
-
Den introducerar en ny funktion som kallas "Artifacts", som gör det möjligt för användare att be Claude att generera dokument, kod, diagram, vektorgrafik och till och med enkla spel.
Lanseringen av Claude 3.5 Sonet visar på Anthropics fortsatta framsteg i utvecklingen av högpresterande och effektiva språkmodeller. Prestandaförbättringarna över ett brett spektrum av benchmarks, samt den nya Artifacts-funktionen, gör detta till en betydande uppdatering av Claude-modellserien.
FAQ
FAQ