KI-generierte Videos überholen Sora? Neueste Entwicklungen erforscht

Erkunden Sie die neuesten KI-Videoerstellungstools wie Cling, Toncraftey, Domo AI und Stable Audio sowie Ankündigungen von Nvidia, AMD, Intel, Qualcomm und Cisco zur Weiterentwicklung der KI-Fähigkeiten. Entdecken Sie KI-generierte Kurzfilme auf dem Tribeca Film Festival und Microsofts KI-gesteuerten Gaming-Assistenten.

24. Februar 2025

party-gif

Entdecken Sie die neuesten Fortschritte in der KI-Videoerzeugung, Animation und Soundeffekten, die die Grenzen des Möglichen erweitern. Erkunden Sie die spannenden Entwicklungen führender Technologieunternehmen und wie diese Werkzeuge die Erstellung von Inhalten revolutionieren können.

Der Aufstieg des Klingens: Beeindruckender KI-Videogenerator

Diese neue KI-Videogeneratorplattform namens Cling, die aus China stammt, ist diese Woche in der KI-Welt für Aufsehen gesorgt. Wenn man eine chinesische Telefonnummer hat, kann man sich angeblich für die App anmelden und sie sofort nutzen.

Die von Cling generierten Videos sind in der Regel etwa 5 Sekunden lang, es gibt aber auch Beispiele für längere Videos. Ein Video zeigt einen Jungen, der Fahrrad fährt, wobei sich die Umgebung vom Wüstenlandschaft zu Schneelandschaften verändert, während das Video voranschreitet. Obwohl die Videos eindeutig KI-generiert sind, sind sie beeindruckend realistisch.

Cling hat auch eine Funktion, mit der man ein Bild und eine Vorlage für eine Aktion hochladen kann, und die KI wird das Bild dann so animieren, dass es zur Aktion passt. Dies hat zu einigen kreativen und unterhaltsamen Beispielen geführt, wie etwa einem Mann, der am Strand tanzt, oder Menschen, die verschiedene Speisen essen.

Insgesamt scheint der Cling-KI-Videogenerator Ergebnisse zu liefern, die besser sind als bei vielen anderen Videogeneratoren, die wir in letzter Zeit gesehen haben, auch wenn sie die Qualität von Sora noch nicht ganz erreichen. Es wird interessant sein zu sehen, wie sich dieses Tool weiterentwickelt und ob es auch außerhalb Chinas zugänglicher wird.

Ton Crafter: Animation zwischen Einzelbildern

Ton Crafter ist ein cooles KI-Tool, mit dem man zwischen zwei Frames animieren kann. Man gibt ihm ein Startbild und ein Endbild, und es generiert die Animation dazwischen.

Das Tool funktioniert am besten mit cartoonartigen oder animeartigen Bildern, nicht mit echten Fotografien. Es kann eine einfache Kopfdrehung oder einen Schritt einer Figur nehmen und den Übergang fließend animieren.

Man kann Ton Crafter jetzt kostenlos auf Hugging Face nutzen. Einfach die Start- und Endbilder hochladen, und das Tool generiert die Animation. Es ist ein Open-Source-Projekt, also kann man den Code auch herunterladen und lokal auf dem eigenen Computer ausführen.

Einige Beispiele für Ton Crafter in Aktion sind:

  • Ein Mann, der mit einem Regenschirm die Straße entlangeht
  • Eine pulsierende und sich verändernde leuchtende Kugel oder ein Edelstein
  • Der Kopf einer Comicfigur, der sich leicht dreht und blinzelt

Insgesamt bietet Ton Crafter eine einfache, aber effektive Möglichkeit, zwischen zwei Frames zu animieren, was es zu einem nützlichen Tool für die Erstellung kurzer, sich wiederholender Animationen macht, ohne jedes Einzelbild manuell zeichnen zu müssen.

Domo KI: Videos in Cartoons verwandeln

Domo AI ist ein Tool, mit dem Anwender reguläres Videomaterial in cartoonartige Animationen umwandeln können. Hier ist, wie es funktioniert:

  • Anwender können eine Videodatei auf die Domo-AI-Plattform hochladen.
  • Das Tool verarbeitet dann das Video und wendet cartoonartige Filter und Effekte an, um eine animierte Version des Originalmaterials zu erstellen.
  • Dies kann für eine Vielzahl von Videoquellen durchgeführt werden, einschließlich Clips aus Filmen, Fernsehsendungen und nutzergeneriertem Content.
  • Die resultierenden animierten Videos behalten die ursprüngliche Bewegung und Aktion bei, haben aber eine verspielt, handgezeichnete Ästhetik.
  • Domo AI übernimmt sogar Aufgaben wie die Lippensynchronisation, um sicherzustellen, dass sich die Münder der Comicfiguren synchron zum Audio bewegen.

Dieses Tool bietet einen einfachen Weg, um Standard-Videos einen einzigartigen, animierten Look und Feel zu verleihen. Es kann für kreative Projekte, Videoessays oder einfach, um bestehenden Aufnahmen etwas visuellen Schwung zu verleihen, verwendet werden. Domo AI macht den Cartoon-Transformationsprozess für eine breite Palette von Nutzern zugänglich.

Verse's Magic Brush: Selektive Animation

Proper Prompter hat kürzlich ein neues Tool namens Verse vorgestellt, das eine Funktion namens Magic Brush enthält. Mit dieser Funktion können Sie einen bestimmten Bereich eines Bildes auswählen und nur diesen ausgewählten Bereich animieren.

Hier sind einige Beispiele dafür, was die Magic-Brush-Funktion leisten kann:

  • Animieren des Zauberstabs von Harry Potter, wobei die Hand und der Zauberstab sich bewegen.
  • Animieren des Gesichts von Elon Musk, so dass er nickt.
  • Animieren eines Raumschiffs beim Start, mit dem austretenden Dampf.
  • Animieren der Hogwarts-Express-Lokomotive, mit Dampf und Bewegung des Zuges.

Die Magic-Brush-Funktion scheint bessere Ergebnisse zu liefern als ähnliche Tools wie Runway, da sie natürlichere und nahtlosere Animationen des ausgewählten Bereichs ermöglicht. Anwender können ein Bild hochladen, den Teil auswählen, den sie animieren möchten, und Verses KI wird diesen Bereich zum Leben erwecken.

Dieses Tool bietet eine weitere leistungsstarke Möglichkeit für Ersteller, Bewegung und Animation zu ihren Bildern hinzuzufügen, ohne die gesamte Szene animieren zu müssen. Die selektive Natur der Magic Brush macht sie zu einem vielseitigen Werkzeug für verschiedenste Anwendungsfälle, von Spezialeffekten bis hin zu kreativen Projekten.

Audiogenerierung: Klangeffekte auf höchstem Niveau

In dieser Woche gab es einige aufregende Entwicklungen im Bereich der KI-generierten Audio. Zwei bemerkenswerte Ankündigungen stachen hervor:

  1. KI-generierte Soundeffekte von 11 Labs: 11 Labs präsentierte eine neue Funktion, mit der Anwender jeden Soundeffekt promoten können, den die KI dann generiert. Beispiele waren ein "Oger, der 'Bleib weg, du Zwerg' sagt" und ein einzigartiger Soundeffekt, der einer Warcraft-artigen Kreatur ähnelte.

  2. Stable Audio-Modell von Stability AI: Stability AI veröffentlichte ein Open-Source-Modell namens Stable Audio, das bis zu 47 Sekunden lange Audiosamples und Soundeffekte, einschließlich Schlagzeugbeats, Instrumentenriffs, Umgebungsgeräusche und Produktionselemente, generieren kann. Die Audioqualität in den Beispielen war sehr beeindruckend.

Diese Fortschritte bei der KI-generierten Audio unterstreichen den rasanten Fortschritt in diesem Bereich. Anwender können nun spezifische Soundeffekte oder Audiosamples promoten, und die KI-Modelle sind in der Lage, hochwertige, realistische Ergebnisse zu produzieren. Dies eröffnet neue Möglichkeiten für die Audioproduktion, Sounddesign und sogar Postproduktion in verschiedenen Branchen.

Da sich diese Tools weiterentwickeln, können wir in naher Zukunft noch beeindruckendere und vielseitigere KI-gesteuerte Audiogenerierungsfähigkeiten erwarten.

Nvidia auf der Computex: Bahnbrechende Ankündigungen

Jensen Huang, der CEO von Nvidia, machte während der Computex-Veranstaltung mehrere wichtige Ankündigungen. Hier sind die Schlüsselpunkte:

  1. Earth 2: Nvidia enthüllte Earth 2, einen digitalen Zwilling der gesamten Erde, der dazu dienen soll, den Klimawandel und das Wetter besser vorherzusagen. Es kann Wettervorhersagen bis auf Zehnermeterskala erstellen, trainiert auf riesigen Mengen an Wetterdaten.

  2. Nvidia Aces: Nvidia präsentierte seine Suite digitaler Menschentechnologien, die Echtzeit-Pfadverfolgungsunterschneidung ermöglichen, um die Art und Weise zu simulieren, wie Licht mit der Haut interagiert, was ihr ein weiches und transluzentes Aussehen verleiht.

  3. GPU-Leistung und -Effizienz: Nvidia demonstrierte, dass seine GPU-Rechenleistung Moores Gesetz bei Weitem übertrifft, während der Stromverbrauch deutlich gesunken ist, was eine effizientere KI-Verarbeitung ermöglicht.

  4. GPU-Roadmap: Nvidia skizzierte seine GPU-Roadmap mit den kommenden Generationen Blackwell, Reuben und zukünftigen Generationen, mit dem Plan, jedes Jahr eine neue GPU auf den Markt zu bringen, um kontinuierliche Fortschritte zu ermöglichen.

  5. Project G Assist: Nvidia stellte Project G Assist vor, einen KI-gesteuerten Assistenten, der Gamer unterstützen kann, indem er Fragen beantwortet und Anleitungen gibt, während sie Videospiele spielen.

  6. Marktposition von Nvidia: Nvidia übertraf kurzzeitig Apple und wurde zum zweitgrößten Unternehmen der Welt, was die wachsende Bedeutung seiner GPU-Technologie im KI-Zeitalter unterstreicht.

Diese Ankündigungen zeigen Nvidias kontinuierliche Führungsrolle im Bereich der KI, von Fortschritten bei digitalen Zwillingen und digitalen Menschen bis hin zu seiner Roadmap für noch leistungsfähigere und effizientere GPU-Hardware. Der Fokus des Unternehmens auf die Förderung von KI-Innovationen ist in seinem gesamten Produktportfolio und seinen zukünftigen Plänen erkennbar.

AMD und Intel auf der Computex: Fokus auf KI

AMD machte auf der Computex einige große Ankündigungen, darunter ihren Prozessor der nächsten Generation für Laptops, den Ryzen AI 300 series. Dieser Chip verfügt über AMDs XDNA 2 NPU, von der das Unternehmen behauptet, dass sie eine 5-mal höhere Rechenleistung und eine doppelte Energieeffizienz im Vergleich zur vorherigen Generation aufweist. Der Ryzen AI 300 wird ab Juli 2024 in einigen Co-Pilot-PCs erhältlich sein.

Auch Intel enthüllte seine Lunar-Lake-Prozessorarchitektur für Endgeräte und treibt damit die Kategorie der KI-gesteuerten PCs weiter voran. Sie präsentierten ihr "KI-Spielfeld", das einen Bildgenerator mit Stable-Diffusion-Modellen sowie einen "Antwort"-Bereich umfasst, der ein ChatGPT-ähnliches Großsprachmodell lokal auf dem Benutzercomputer ausführt.

Der Schlüsselpunkt ist, dass sich alle großen Chiphersteller - Nvidia, AMD, Intel und Qualcomm - auf die Entwicklung von Hardware konzentrieren, die speziell für KI-Verarbeitung optimiert ist. Dies spiegelt die wachsende Bedeutung von KI-Fähigkeiten im Verbraucher- und Unternehmenscomputing wider. Die auf der Computex angekündigten neuen Chips und Technologien zielen darauf ab, effizientere und leistungsfähigere KI-Anwendungen auf einer Vielzahl von Geräten zu ermöglichen.

Cisco Live: Stärkung der digitalen Resilienz

Der Fokus von Cisco auf ihrer jüngsten Cisco-Live-Veranstaltung lag auf der Verbesserung der "digitalen Resilienz" - der Fähigkeit von Unternehmen, mit Problemen umzugehen, die in der digitalen Welt auftreten können, wie Hacks, Cybersicherheitsbedrohungen und Probleme mit der Datenintegrität.

Cisco setzt KI ein, um Unternehmen dabei zu unterstützen, ihre digitale Infrastruktur besser zu überwachen und zu verwalten. Sie haben ein Tool namens ThousandEyes entwickelt, das mit KI die gesamte digitale Umgebung eines Unternehmens im Blick behält, Probleme meldet und dabei hilft, die Ursache schnell zu identifizieren.

Während Verbraucher die Technologien von Cisco möglicherweise nicht direkt nutzen, verlassen sich die Unternehmen, die die von uns genutzten Dienste und Tools bereitstellen, wahrscheinlich auf Ciscos Infrastruktur. Durch die Verbesserung der digitalen Resilienz mittels KI zielt Cisco darauf ab, die allgemeine Sicherheit und Zuverlässigkeit der digitalen Systeme, von denen wir alle abhängig sind, zu verbessern.

Neben der Entwicklung eigener KI-gestützter Tools kündigte Cisco einen globalen KI-Investitionsfonds in Höhe von 1 Milliarde US-Dollar an, um das Wachstum innovativer KI-Lösungen in diesem Bereich zu unterstützen. Das Unternehmen erkennt die entscheidende Rolle, die KI für die Gewährleistung der Sicherheit und Stabilität unserer digitalen Welt in Zukunft spielen wird.

Apple WWDC: Erwartungen an KI-Fortschritte

Auf der bevorstehenden Worldwide Developers Conference (WWDC) von Apple werden laut Berichten umfangreiche KI-Ankündigungen erwartet. Der Technologieriese plant, eine Reihe neuer KI-Funktionen und -Fähigkeiten in seiner gesamten Produktpalette vorzustellen.

Eine der Schlüsselerwartungen ist die Einführung einer überarbeiteten "Apple Intelligence"-Plattform, die voraussichtlich die derzeitige Siri-Künstliche-Intelligenz ersetzen wird. Das neue System soll erhebliche Verbesserungen bei der natürlichen Sprachverarbeitung, der Aufgabenerfüllung und der Integration in das Apple-Ökosystem bieten.

Darüber hinaus wird gemunkelt, dass Apple fortschrittlichere KI-Fähigkeiten in seine Kernprodukte wie iPhone, iPad und Mac integrieren wird. Dazu könnten Funktionen wie verbesserte Bilderkennung, erweiterte Sprachsteuerung und intelligentere Persönliche-Assistenten-Funktionalitäten gehören.

Das Unternehmen wird voraussichtlich auch Fortschritte in seinen Augmented-Reality- (AR) und Mixed-Reality- (MR) Technologien präsentieren, die wahrscheinlich KI für Aufgaben wie Objekterkennung, Szenenverständnis und nahtlose Integration digitaler Inhalte nutzen werden.

Dar

FAQ