AI-genererade videor överträffar Sora? Senaste utvecklingen utforskad

Utforska de senaste AI-videogenerationsverktygen som Cling, Toncraftey, Domo AI och Stable Audio, samt tillkännagivanden från Nvidia, AMD, Intel, Qualcomm och Cisco om att förbättra AI-funktioner. Upptäck AI-genererade kortfilmer på Tribeca Film Festival och Microsofts AI-drivna spelassistent.

24 februari 2025

party-gif

Upptäck de senaste framstegen inom AI-videogenerering, animation och ljudeffekter som driver gränserna för vad som är möjligt. Utforska de spännande utvecklingarna från ledande teknikföretag och hur dessa verktyg kan revolutionera innehållsskapandet.

Framväxten av Cling: Imponerande AI-videogenerator

Denna nya AI-videogeneratorn som heter Cling, som kommer från Kina, har varit samtalsämnet i AI-världen den här veckan. Om du har ett kinesiskt telefonnummer kan du rapporterat registrera dig för appen och använda den direkt.

Videorna som genereras av Cling är vanligtvis runt 5 sekunder långa, men det finns exempel på längre videor också. En video visar en pojke som cyklar, där miljön ändras från öken till snölandskap allteftersom videon fortskrider. Även om videorna tydligt är AI-genererade är de imponerande realistiska.

Cling har också en funktion som låter dig ladda upp en bild och en mallåtgärd, och den kommer att animera bilden för att matcha åtgärden. Detta har resulterat i några kreativa och underhållande exempel, som en man som dansar på stranden eller människor som äter olika livsmedel.

Sammanfattningsvis verkar Cling AI-videogeneratorn producera resultat som är bättre än många andra videogeneratorer vi sett på sistone, även om de fortfarande inte riktigt når upp till kvaliteten på Sora. Det kommer att vara intressant att se hur det här verktyget utvecklas och om det blir mer tillgängligt utanför Kina.

Ton Crafter: Animering mellan ramar

Ton Crafter är ett coolt AI-verktyg som kan animera mellan två ramar. Du ger det en startbild och en slutbild, och det kommer att generera animationen däremellan.

Verktyget fungerar bäst med tecknade eller animeliknande bilder, snarare än riktiga fotografier. Det kan ta en enkel huvudvridning eller en karaktär som tar ett steg och animera övergången smidigt.

Du kan använda Ton Crafter gratis på Hugging Face just nu. Ladda bara upp dina start- och slutbilder, och verktyget kommer att generera animationen. Det är ett öppen källkodsprojekt, så du kan också ladda ner koden och köra den lokalt på din egen dator.

Några exempel på Ton Crafter i aktion inkluderar:

  • En man som går ner för gatan med ett paraply
  • En lysande orb eller juvel som pulserar och ändras
  • Ett tecknat karaktärs huvud som vrider sig lite och blinkar

Sammanfattningsvis ger Ton Crafter ett enkelt men effektivt sätt att animera mellan två ramar, vilket gör det till ett användbart verktyg för att skapa korta, loopande animationer utan att behöva rita varje ram manuellt.

Domo AI: Förvandla videor till tecknade filmer

Domo AI är ett verktyg som låter användare förvandla vanligt videomaterial till tecknade animationer. Så här fungerar det:

  • Användare kan ladda upp en videofil till Domo AI-plattformen.
  • Verktyget bearbetar sedan videon och applicerar tecknade stilfilter och effekter för att skapa en animerad version av det ursprungliga materialet.
  • Detta kan göras för olika videokällor, inklusive klipp från filmer, TV-serier och användarskapat innehåll.
  • De resulterande animerade videorna behåller den ursprungliga rörelsen och handlingarna, men med en fantasifull, handritad estetik.
  • Domo AI hanterar till och med uppgifter som läppsynkronisering, vilket säkerställer att de tecknade karaktärernas munnar rör sig i takt med ljudet.

Detta verktyg ger ett enkelt sätt att ge vanliga videor ett unikt, animerat utseende och känsla. Det kan användas för kreativa projekt, videoesejer eller helt enkelt för att lägga till visuell charm till befintligt material. Domo AI gör den tecknade transformationsprocessen tillgänglig för en bred grupp användare.

Verses magiska pensel: Selektiv animation

Proper prompter delade nyligen ett nytt verktyg som heter Verse, som innehåller en funktion som kallas Magic Brush. Den här funktionen låter dig välja en specifik del av en bild och animera bara det valda området.

Här är några exempel på vad Magic Brush-funktionen kan göra:

  • Animera Harry Potters trollstav, där handen och trollstaven rör sig.
  • Animera Elon Musks ansikte, så att han nickar.
  • Animera en raket som lyfter, med ångan som kommer ut.
  • Animera Hogwarts Express-tåget, med ångan och tågets rörelse.

Magic Brush-funktionen verkar ge bättre resultat än liknande verktyg som Runway, vilket möjliggör mer naturliga och sömlösa animationer av de valda områdena. Användare kan ladda upp en bild, välja den del de vill animera, och Verses AI kommer att ge liv åt det valet.

Detta verktyg ger ytterligare ett kraftfullt sätt för skapare att lägga till animation och rörelse i sina bilder, utan att behöva animera hela scenen. Den selektiva naturen hos Magic Brush gör det till ett mångsidigt verktyg för olika användningsområden, från visuella effekter till kreativa projekt.

Ljudgenerering: Ljud på nästa nivå

Den här veckan såg några spännande utvecklingar inom AI-genererad ljud. Två anmärkningsvärda tillkännagivanden stack ut:

  1. 11 Labs' AI-genererade ljudeffekter: 11 Labs visade upp sin nya funktion som låter användare prompta valfri ljudeffekt, som AI:n sedan genererar. Exempel inkluderade en "troll som säger 'håll dig borta, lilla människa'" och en unik ljudeffekt som liknade en Warcraft-liknande varelse.

  2. Stability AI:s Stable Audio-modell: Stability AI släppte en öppen källkodmodell som kallas Stable Audio, som kan generera upp till 47 sekunder av ljudprover och ljudeffekter, inklusive trumslag, instrumentriff, omgivande ljud och produktionselement. Ljudkvaliteten som demonstrerades i exemplen var ganska imponerande.

Dessa framsteg inom AI-genererat ljud belyser den snabba utvecklingen inom detta område. Användare kan nu prompta specifika ljudeffekter eller ljudprover, och AI-modellerna kan producera högkvalitativa, realistiska resultat. Detta öppnar upp nya möjligheter för ljudskapande, ljuddesign och till och med ljudefterproduktion inom olika branscher.

När dessa verktyg fortsätter att utvecklas kan vi förvänta oss att se ännu mer imponerande och mångsidiga AI-drivna ljudgenereringsförmågor i den nära framtiden.

Nvidia på Computex: Banbrytande tillkännagivanden

Jensen Huang, VD för Nvidia, gjorde flera betydande tillkännagivanden under Computex-evenemanget. Här är de viktigaste höjdpunkterna:

  1. Earth 2: Nvidia presenterade Earth 2, en digital tvilling av hela jorden, utformad för att bättre förutsäga klimatförändringar och väder. Den kan göra hyperlokal prognostisering ner till tiotals meter, tränad på stora mängder väderdata.

  2. Nvidia Aces: Nvidia visade upp sin svit av digitala människoteknologier, vilket möjliggör realtidsväg-spårad subytlig spridning för att simulera hur ljus interagerar med hud, vilket ger den ett mjukt och genomskinligt utseende.

  3. GPU-prestanda och effektivitet: Nvidia demonstrerade att dess GPU-beräkningskraft långt överträffar Moores lag, samtidigt som strömförbrukningen har sjunkit avsevärt, vilket möjliggör effektivare AI-bearbetning.

  4. GPU-vägkarta: Nvidia skisserade sin GPU-vägkarta, med de kommande Blackwell-, Reuben- och framtida generationerna, med planer på att släppa en ny GPU varje år för att driva kontinuerliga framsteg.

  5. Project G Assist: Nvidia presenterade Project G Assist, en AI-driven assistent som kan hjälpa spelare genom att svara på frågor och ge vägledning medan de spelar spel.

  6. Nvidias marknadsposition: Nvidia överskred kort Apple för att bli det näst största företaget i världen, vilket belyser den växande betydelsen av dess GPU-teknik i AI-eran.

Dessa tillkännagivanden visar Nvidias fortsatta ledarskap inom AI-området, från framsteg inom digitala tvillingar och digitala människor till dess vägkarta för ännu kraftfullare och effektivare GPU-maskinvara. Företagets fokus på att driva AI-innovation är tydligt över hela sin produktportfölj och framtidsplaner.

AMD och Intel på Computex: Fokus på AI

AMD gjorde några stora tillkännagivanden på Computex, inklusive deras nästa generations bärbara processor, Ryzen AI 300-serien. Den här chipen har AMDs XDNA 2 NPU, som de hävdar har 5 gånger mer beräkningskapacitet och dubbel energieffektivitet jämfört med föregående generation. Ryzen AI 300 kommer att finnas i vissa co-pilot-datorer från och med juli 2024.

Intel avslöjade också sin Lunar Lake-arkitektur för klientprocessorer, vilket fortsätter att utveckla den AI-drivna PC-kategorin. De visade upp sin "AI Playground" som inkluderar en bildgenerator som använder stabila diffusionsmodeller, samt en "Svar"-sektion som tillhandahåller en ChatGPT-liknande språkmodell som körs lokalt på användarens dator.

Nyckelinsikten är att alla de stora chiptillverkarna - Nvidia, AMD, Intel och Qualcomm - fokuserar på att utveckla maskinvara som är specifikt optimerad för AI-bearbetning. Detta återspeglar den ökande betydelsen av AI-funktioner i konsument- och företagsdatorer. De nya chipen och teknologierna som presenterades på Computex syftar till att möjliggöra effektivare och kraftfullare AI-tillämpningar på en bred uppsättning enheter.

Cisco Live: Förbättrad digital motståndskraft

Ciscos fokus på deras senaste Cisco Live-evenemang var att förbättra "digital resiliens" - företags förmåga att hantera problem som kan uppstå i den digitala världen, som hackningar, cybersäkerhetshot och dataintegritetsutmaningar.

Cisco använder AI för att hjälpa företag att bättre övervaka och hantera sin digitala infrastruktur. De har utvecklat ett verktyg som heter ThousandEyes, som använder AI för att hålla koll på ett företags hela digitala miljö och varna dem för problem samt hjälpa dem snabbt identifiera källan.

Medan konsumenter kanske inte direkt använder Ciscos teknologier, förlitar sig de företagsföretag som tillhandahåller de tjänster och verktyg vi använder sannolikt på Ciscos infrastruktur. Genom att förbättra den digitala motståndskraften genom AI strävar Cisco efter att förbättra den övergripande säkerheten och tillförlitligheten i de digitala system vi alla är beroende av.

Utöver att utveckla sina egna AI-drivna verktyg, annonserade Cisco en global AI-investeringsfond på 1 miljard dollar för att stödja tillväxten av innovativa AI-lösningar inom detta område. Företaget erkänner den vitala roll som AI kommer att spela för att säkerställa säkerheten och stabiliteten i vår digitala värld framöver.

Apple WWDC: Förväntningar på AI-framsteg

Apples kommande Worldwide Developers Conference (WWDC) förväntas bli en stor händelse för AI-tillkännagivanden. Enligt rapporter planerar teknikjätten att presentera en rad nya AI-funktioner och -möjligheter över hela sin produktportfölj.

En av de viktigaste förväntningarna är introduktionen av en omarbetad "Apple Intelligence"-plattform, som sannolikt kommer att ersätta den nuvarande Siri-artificiella intelligensen. Det nya systemet förväntas erbjuda betydande förbättringar inom naturlig språkbehandling, uppgiftsutförande och integrering med Apples ekosystem.

Dessutom ryktas Apple integrera mer avancerade AI-funktioner i sina kärnprodukter, som iPhone, iPad och Mac. Detta skulle kunna innefatta funktioner som förbättrad bildigeninkning, förbättrade röstkommandon och mer intelligenta personliga assistentfunktioner.

Företaget förväntas också visa upp framsteg inom sina förstärkta verklighet (AR) och blandad verklighet (MR)-teknologier, som sannolikt kommer att dra nytta av AI för uppgifter som objektigenkänning, scenverstående och sömlös integrering med digitalt innehåll.

Furthermore, Apple kan presentera nya utvecklarverktyg och API:er som kommer att möjliggöra för tredjepartsapputvecklare att dra nytta av företagets AI-funktioner inom sina egna applikationer. Detta skulle kunna leda till en våg av AI-drivna upplevelser över Apples ekosystem.

Sammanfattningsvis är förväntningarna på Apples WWDC-evenemang höga, med potential för betydande AI-drivna innovationer som skulle kunna forma framtiden för företagets produkter och tjänster. I takt med att teknikbranschen fortsätter att prioritera AI-utveckling, kommer Apples tillkännagivanden att följas noga av både konsumenter och branschanalytiker.

Microsofts och Googles återkallningsfunktioner: Integritetsfrågor

När en hackare utvecklade ett verktyg för att extrahera data från Microsofts nya "återkallningsfunktion" väckte det oro kring integritet och dataskydd. Som svar har Microsoft gjort flera uppdateringar för att hantera dessa problem:

  • Återkallningsfunktionen kommer nu att vara avstängd som standard, vilket kräver att användare aktivt aktiverar den.
  • Bevis på närvaro kommer att krävas för att visa tidslinje och söka i återkallningsdata.
  • Ytterligare dataskyddsåtgärder kommer att läggas till, inklusive just-in-time-dekryptering och lokal lagring av ögonblicksbilder (inte i molnet).
  • Användare kommer att ha mer kontroll för att pausa, filtrera och ta bort det som sparas i återkallningsfunktionen.

Microsoft försöker tydligt hantera "creepy-faktorn" och se till att användare har mer transparens och kontroll över sina data.

Google utforskar också en liknande "minnes"-funktion för Chromebooks, och de strävar också efter att eliminera de potentiella integritetsbekymren kring en sådan funktion.

Nyckelinsikten är att när dessa AI-drivna produktivitetsfunktioner blir mer utbredda måste teknikföretag noggrant balansera fördelarna med robusta integritetsskyddsåtgärder. Utvecklare kommer att behöva vara proaktiva i att hantera eventuell missbruk eller exploatering av dessa tekn

FAQ