KI-Nachrichten: Eine geschäftige Woche bei KI-Fortschritten und -Entwicklungen

Entdecken Sie die neuesten KI-Fortschritte und -Entwicklungen der letzten Woche, darunter OpenAIs fortschrittliches Sprachfeature, GPT-4s Fähigkeiten für lange Ausgaben, Microsofts Behauptungen über KI-Wettbewerbe und Updates von Google, Anthropic, Meta und mehr. Bleiben Sie auf dem Laufenden in der sich ständig weiterentwickelnden Welt der KI.

19. Februar 2025

Dieser Blogbeitrag bietet einen umfassenden Überblick über die neuesten Fortschritte in der Welt der KI und deckt ein breites Spektrum an Themen ab, von neuen Sprachfunktionen in OpenAIs ChatGPT bis hin zur Übernahme von Leonardo AI durch Canva. Die Leser erhalten Einblicke in die sich schnell entwickelnde KI-Landschaft und die spannenden Entwicklungen, die die Zukunft dieser Technologie prägen.

Open AIs fortschrittliches Sprachfunktion

Open AI hat begonnen, eine fortgeschrittene Sprachfunktion an eine ausgewählte Gruppe von Nutzern auszurollen. Diese neue Funktion ermöglicht es Nutzern, menschenähnliche Stimmen zu generieren, einschließlich der Fähigkeit, Stimmen wie die von Scarlett Johansson nachzuahmen.

Einige Hauptmerkmale des erweiterten Sprachmodus:

Nutzer mit Zugriff können die Option "Erweiterter Sprachmodus" am unteren Rand des Chatfensters ausprobieren.
Es kann sehr realistisch klingende Stimmen erzeugen, einschließlich der Fähigkeit, Stimmen von Prominenten und öffentlichen Personen nachzuahmen.
Nutzer können die Stimme unterbrechen, während sie spricht, eine Funktion, die in der Standard-Chat-GPT-App nicht verfügbar ist.
Demos zeigen, dass das Stimmmodell sehr schnell zählen kann und sogar das Atmen simulieren kann.

GPT-4 Langzeitausgabe

Open AI hat kürzlich eine experimentelle Version von GPT-4 mit dem Namen "GPT-4 Long Output" eingeführt. Dieses neue Modell hat eine maximale Ausgabe von 64.000 Token pro Anfrage, was deutlich längere und detailliertere Antworten als das Standard-GPT-4-Modell ermöglicht.

Das GPT-4 Long Output-Modell ist derzeit nur für eine ausgewählte Gruppe von Alpha-Teilnehmern verfügbar und ist für die breite Öffentlichkeit noch nicht zugänglich. Diese experimentelle Version soll Nutzern die Möglichkeit geben, extrem lange und umfassende Ausgaben als Antwort auf ihre Anfragen zu generieren.

Während die Details der Modellarchitektur und des Trainingsprozesses nicht öffentlich bekannt gegeben wurden, wird die erhöhte Ausgabelänge wahrscheinlich durch Fortschritte in den Gedächtnis- und Reasoning-Fähigkeiten des Modells erreicht. Dies ermöglicht es dem Modell, den Kontext und die Kohärenz über einen viel längeren Textbereich beizubehalten und detailliertere und tiefgründigere Antworten zu liefern.

Die potenziellen Anwendungen des GPT-4 Long Output-Modells sind vielfältig und reichen von erweiterten Forschungs- und Analysaufgaben bis hin zur Erstellung von Langform-Inhalten wie Berichten, Essays oder sogar Büchern. Allerdings gibt es wie bei jeder leistungsfähigen KI-Technologie auch Bedenken hinsichtlich möglichen Missbrauchs oder unbeabsichtigter Folgen.

Open AI als Konkurrenz zu Microsoft

Diese Woche behauptet Microsoft, dass Open AI ein Wettbewerber in KI und Suche ist. Das ist interessant, da Microsoft 13 Milliarden Dollar in Open AI investiert hat und 49% des Unternehmens besitzt.

In ihren Finanzberichten listete Microsoft Unternehmen wie Anthropic, Open AI, Meta und andere Open-Source-Angebote als Wettbewerber für ihre KI-Angebote auf. Das ist seltsam, da Open AI zu 49% Microsoft gehört und sie auch Partnerschaftsvereinbarungen mit Meta haben.

Es scheint, dass Microsoft Open AI nun als Konkurrenz zu ihrem eigenen Suche- und Nachrichtenanzeigengeschäft sieht, obwohl sie einen großen Anteil an dem Unternehmen haben. Das ist eine sehr interessante Dynamik, die sich zwischen den beiden Unternehmen entwickelt hat.

Open AIs Befürwortung der KI-Regulierung

Open AI hat diese Woche einige Senatsentwürfe zur KI-Regulierung und -Sicherheit unterstützt. Dazu gehört der Future of AI Innovation Act, der das United States AI Safety Institute als bundesstaatliche Behörde formell autorisieren würde, um Standards und Richtlinien für KI-Modelle festzulegen.

Open AI unterstützte auch den NSF AI Education Act und den CREATE AI Act, die Bundesstipendienprogramme für KI-Forschung und die Einrichtung von KI-Bildungsressourcen an Hochschulen und Schulen der Sekundarstufe schaffen.

Diese Unterstützung durch Open AI dient wahrscheinlich dazu, dem Unternehmen einen Sitz am Verhandlungstisch bei zukünftigen Gesprächen über KI-Regulierung zu verschaffen. Als großes KI-Unternehmen ist Open AI ein wahrscheinlicher Kandidat für regulatorische Überprüfungen in Zukunft. Durch die Unterstützung dieser Gesetze kann Open AI die Richtung der Regulierung mitgestalten und sicherstellen, dass seine Interessen vertreten werden.

Anthropic startet Claud in Brasilien

Gute Nachrichten für Brasilianer - Anthropic hat diese Woche seinen KI-Assistenten Claud im Land eingeführt. Claud ist nun für Nutzer in Brasilien verfügbar und kann interaktiv genutzt werden.

Googles Gemini 1.5 Pro und andere KI-Modelle

Google hat diese Woche auch große Wellen in der KI-Welt geschlagen. Sie veröffentlichten eine neue Version von Gemini 1.5 Pro, die sie Version 0801 nennen und die jetzt in Googles AI Studio verwendet werden kann.

Um darauf zuzugreifen, können Sie zu AI Studio .g google.com gehen und unter der Dropdown-Liste "Modell" "Gemini 1.5 Pro experimental 0801" auswählen - das ist das Modell, das Sie verwenden möchten.

Wenn Sie mit diesem neuen Gemini 1.5 Pro-Modell chatten, hat es die Rangliste auf lm.org angeführt und sogar GPT-4, GPT-4 Mini, CLAE 3.5 und Sonet übertroffen.

Google veröffentlichte auch eine neue kleinere Version ihres Gemini 2-Modells - ein 2-Milliarden-Parameter-Modell, das für schnellere Leistung und Effizienz ausgelegt ist, wahrscheinlich für mobile Geräte. Interessanterweise übertrifft dieses 2-Milliarden-Parameter-Modell viel größere Modelle wie Mixdral 8X 7B, GPT-3.5 Turbo und LLaMA 2 70 Milliarden.

Googles neue Chrome-KI-Funktionen

Google hat diese Woche einige beeindruckende neue KI-Funktionen in Chrome hinzugefügt, darunter die Integration von Google Lens, mit der Objekte in Bildern identifiziert und durchsucht werden können, sowie eine neue Vergleichsfunktion, mit der Produkte über verschiedene Websites hinweg verglichen werden können.

Metas eingestellte KI-Chatbots und neues KI-Studio

Diese Woche hat Meta eine der Funktionen eingestellt, die sie auf der letzten Meta Connect angekündigt hatten. Sie hatten KI-Chatbots gezeigt, die wie berühmte Personen aussahen, aber nicht die tatsächlichen Chatbots dieser berühmten Personen waren - sie verwendeten nur deren Gesicht, wurden aber mit anderen Informationen trainiert. Aber niemand mochte das wirklich, also hat Meta es wieder entfernt.

Stattdessen haben sie etwas anderes eingeführt - jetzt kann jeder seine eigene benutzerdefinierte KI erstellen. Meta hat ein KI-Studio eingeführt, und einer meiner Freunde, Don Allen Stevenson, ist einer der Leute, die frühen Zugriff darauf bekommen haben.

Diese neue Funktion ermöglicht es jedem, KI-Charaktere basierend auf ihren Interessen zu erstellen. Sie können zu ai.meta.com/AI-Studio gehen und Ihren eigenen benutzerdefinierten KI-Charakter erstellen, wobei Sie Optionen wie KI-Haustier, privater Tutor, Mitfan, fantasievoller Künstler, Ideengeber, kreativer Designer, persönlicher Stylist und mehr auswählen können.

Metas Segment Anything Modell 2

Meta hat eine neue Version ihres Segment Anything Model, genannt SAM 2, veröffentlicht. Dieses aktualisierte Modell zeigt deutliche Verbesserungen bei der Genauigkeit der Objektsegmentierung in Bildern und Videos.

Einige Schlüsselmerkmale von SAM 2 sind:

Verbesserte Fähigkeit, Objekte durch Verdeckung zu verfolgen - das Modell kann ein Objekt auch dann weiterverfolgen, wenn es vorübergehend von einem anderen Objekt verdeckt wird.
Erhöhte Segmentierungsgenauigkeit, die es dem Modell ermöglicht, die Grenzen erkannter Objekte präziser zu umreißen.
Schnellere Verarbeitungsgeschwindigkeit, die Echtzeitverarbeitung in Videoanwendungen ermöglicht.
Erweiterte Vielseitigkeit, da das Modell eine breite Palette von Objekten segmentieren kann, von Menschen und Tieren bis hin zu komplexeren Formen und Strukturen.

Perplexity Publishers Programm

Perplexity, die KI-gesteuerte Suchmaschine, hat das Perplexity Publishers Program angekündigt. Dieses Programm zielt darauf ab, Einnahmen mit bestimmten Partnern zu teilen, deren Inhalte als Nachrichtenquelle auf der Perplexity-Plattform verwendet werden.

Die erste Gruppe von Partnern, die in dieses Programm aufgenommen wurden, sind:

Time
Der Spiegel
Fortune
Entrepreneur
The Texas Tribune
WordPress.com

Obwohl dieses Programm derzeit nur größere Verlage umfasst, hat Perplexity den Wunsch geäußert, in Zukunft auch normale Blogger und Inhaltserstellern zu motivieren, ihre Inhalte für die Plattform zu lizenzieren.

Leonardo KI von Canva übernommen

Diese Woche kam die große Nachricht, dass Leonardo AI, eines der führenden KI-Bildgenerierungstools, von der Designplattform Canva übernommen wurde. Dies ist aus mehreren Gründen eine bedeutende Entwicklung:

Integration in Canva: Mit Leonardo AI als Teil des Canva-Ökosystems werden Nutzer irgendwann in der Lage sein, die leistungsfähigen Bildgenerierungsfähigkeiten direkt innerhalb der Canva-Plattform zu nutzen.
Verbessertes Canva-KI: Canvas derzeitige KI-Bildgenerierungsfähigkeiten waren etwas schwächer im Vergleich zu anderen Tools wie DALL-E und Midjourney. Durch die Integration von Leonardos proprietärem "Phoenix"-Modell wird sich Canvas KI-Bildgenerierung dramatisch verbessern.
Beraterperspektive: Der Autor weist darauf hin, dass er seit über einem Jahr Berater für Canva ist, sodass diese Übernahme auch für ihn persönlich von Vorteil ist.

Mid Journey Update 6.1

Midjourney hat diese Woche Version 6.1 veröffentlicht, die die Bildqualität, Kohärenz und Textverarbeitung deutlich verbessert. Einige Schlüsselhighlights:

Erhebliche Verbesserungen bei der Bildqualität und -kohärenz. Die gezeigten Beispiele demonstrieren ein hohes Maß an Realismus, das schwer von echten Bildern zu unterscheiden ist.
Bessere Handhabung von Textaufforderungen, selbst für unsinnige oder erfundene Wörter. Das Modell scheint die Absicht hinter dem Text zu verstehen und generiert entsprechende Bildgebung.
Ein neues Upscaling- und Personalisierungsmodell, das die generierten Bilder weiter verbessert.

Neue 3D-Modell-Generatoren

Es gibt einige neue Fortschritte bei der KI-gesteuerten 3D-Modellgenerierung:

Edify 3D von NVIDIA und Shutterstock:
- Edify 3D ist ein neues Modell, das in Zusammenarbeit zwischen NVIDIA und Shutterstock entwickelt wurde.
- Es ermöglicht die Generierung von 3D-Modellen aus Textaufforderungen auf der Website build.nvidia.com.
- Zum Beispiel kann man eine Aufforderung wie "ein grauer Wolf, der zum Mond heult" eingeben und Vorschauen auf 3D-Modelle erhalten.
Stable Fast 3D von Stability AI:
- Stable Fast 3D ist ein schnelles 3D-Asset-Generierungsmodell von Stability AI.
- Es kann 3D-Modelle aus Einzelbildern in weniger als einer Sekunde generieren.
- Das Modell ist über die Stable Assistant API und auf Hugging Face verfügbar.
Neues 3D-Modell von Black Forest Labs:
- Black Forest Labs, ein neues KI-Forschungsunternehmen, hat ein neues Open-Source-Text-zu-Bild-Modell namens Flux veröffentlicht.
- Flux kann verwendet werden, um 3D-Modelle aus Textaufforderungen zu generieren, zusätzlich zu 2D-Bildern.

Black Forest Labs' neues Flux-Modell

Runway, die KI-gesteuerte Videoproduktionsplattform, hat diese Woche zwei neue Funktionen eingeführt: Image to Video und Gen 3 Alpha Turbo.

Image to Video: Runway hat jetzt ein Image-to-Video-Modell eingeführt, mit dem Nutzer statische Bilder in dynamische Videoinhalte umwandeln können. Diese Funktion ist eine wichtige Ergänzung zu Runways Fähigkeiten, da sie Nutzern ermöglicht, ihren visuellen Assets neues Leben einzuhauchen.

Gen 3 Alpha Turbo: Runway hat auch die Veröffentlichung von Gen 3 Alpha Turbo angekündigt, einer schnelleren und effizienteren Version ihres Gen 3 Alpha-Videomodells. Laut Runways Demonstrationen kann Gen 3 Alpha Turbo Videoausgaben viel schneller generieren als die vorherige Version, mit einer Generierungszeit von nur 11 Sekunden.

Runways Bild zu Video und Gen 3 Alpha Turbo

Der Aufstieg von KI-generierten Avataren und Influencern ist ein faszinierender und besorgniserregender Trend. Während die zugrunde liegende Technologie beeindruckend ist, ist das Potenzial für Missbrauch und die Verbreitung von Desinformation beunruhigend.

Einerseits können KI-gesteuerte Avatare dazu verwendet werden, hochrealistische digitale Repräsentationen von Menschen zu schaffen, was die Erstellung von "digitalen Zwillingen" für verschiedene Anwendungen ermöglicht. Dies könnte in Bereichen wie Unterhaltung von Vorteil sein.

Andererseits ist das Potenzial für den Missbrauch dieser Werkzeuge erheblich. KI-generierte Influencer könnten beispielsweise dazu verwendet werden, Propaganda zu verbreiten, Produkte ohne ordnungsgemäße Offenlegung zu bewerben oder sogar echte Personen zu imitieren

FAQ

Welche neue fortschrittliche Sprachfunktion führt OpenAI gerade ein?

Welche neue GPT-4-Funktion für lange Ausgaben hat OpenAI eingeführt?

Wie sieht Microsoft OpenAI als Wettbewerber?

Welche neuen KI-Funktionen hat Google veröffentlicht?

Welche neuen KI-Funktionen hat Meta veröffentlicht?

Welche neuen KI-gesteuerten Videotools wurden veröffentlicht?

Welche rechtlichen Probleme haben KI-Unternehmen zu bewältigen?

Welche anderen bemerkenswerten KI-Nachrichten gab es diese Woche?

Erstelle Deine AI-Freundin

Baue deinen idealen Begleiter mit unserem AI-Freundin-Ersteller