AI-nieuws: Een drukke week in AI-vooruitgang en -ontwikkelingen
Ontdek de nieuwste AI-vooruitgang en -ontwikkelingen van de afgelopen week, waaronder de geavanceerde stemfunctie van OpenAI, de lange outputmogelijkheden van GPT-4, de claims van Microsoft over AI-competitie en updates van Google, Anthropic, Meta en meer. Blijf voorop lopen in de voortdurend evoluerende wereld van AI.
16 februari 2025

Deze blogpost biedt een uitgebreid overzicht van de nieuwste ontwikkelingen in de wereld van AI, waarbij een breed scala aan onderwerpen wordt behandeld, van nieuwe spraakfuncties in OpenAI's ChatGPT tot de overname van Leonardo AI door Canva. Lezers zullen inzicht krijgen in het snel evoluerende AI-landschap en de opwindende ontwikkelingen die de toekomst van deze technologie vormgeven.
Open AI's Advanced Voice Feature
GPT-4 Long Output
Open AI als concurrent van Microsoft
Open AI's ondersteuning van AI-regulering
Anthropic lanceert Claud in Brazilië
Google's Gemini 1.5 Pro en andere AI-modellen
Google's nieuwe Chrome AI-functies
Meta's verwijderde AI-chatbots en nieuwe AI-studio
Meta's Segment Anything Model 2
Perplexity Publishers Program
Leonardo AI overgenomen door Canva
Mid Journey Update 6.1
Nieuwe 3D-modelgeneratoren
Black Forest Labs' nieuwe Flux-model
Runway's Image to Video en Gen 3 Alpha Turbo
AI-gegenereerde avatars en influencers
Vimeo's automatische videotranslatie
Anthropic's reactie op rechtszaken
De "Friend" AI-halsketting-controverse
Ander AI-nieuws
Open AI's Advanced Voice Feature
Open AI's Advanced Voice Feature
Open AI is begonnen met het uitrollen van een geavanceerde spraakfunctie voor een select aantal gebruikers. Deze nieuwe functie stelt gebruikers in staat om mensachtige stemmen te genereren, inclusief de mogelijkheid om stemmen na te bootsen zoals die van Scarlett Johansson.
Enkele belangrijke hoogtepunten van de geavanceerde spraakmodus:
- Gebruikers met toegang kunnen de optie "Geavanceerde spraakmodus" proberen onderaan het chatvenster.
- Het kan zeer realistische stemmen genereren, inclusief de mogelijkheid om stemmen van beroemdheden en openbare figuren na te bootsen.
- Gebruikers kunnen de stem onderbreken terwijl deze aan het spreken is, een functie die niet beschikbaar is in de standaard ChatGPT-app.
- Demonstraties laten zien dat het stemmodel zeer snel kan tellen, zelfs met het simuleren van de noodzaak om adem te halen.
GPT-4 Long Output
GPT-4 Long Output
Open AI heeft onlangs een experimentele versie van GPT-4 uitgebracht, genaamd "GPT-4 Long Output". Dit nieuwe model heeft een maximale output van 64.000 tokens per aanvraag, waardoor veel langere en gedetailleerdere antwoorden mogelijk zijn in vergelijking met het standaard GPT-4-model.
Het GPT-4 Long Output-model is momenteel alleen beschikbaar voor een selecte groep Alpha-deelnemers en is nog niet toegankelijk voor het grote publiek. Deze experimentele versie is ontworpen om gebruikers de mogelijkheid te bieden om extreem lange en uitgebreide outputs te genereren in reactie op hun vragen.
Hoewel de details van de architectuur en het trainingproces van het model niet openbaar zijn gemaakt, wordt de verhoogde outputlengte waarschijnlijk bereikt door verbeteringen in het geheugen en de redeneervaardigheden van het model. Hierdoor kan het model context en samenhang behouden over een veel langere tekstspanne, waardoor het meer gedetailleerde en diepgaande antwoorden kan geven.
De potentiële toepassingen van het GPT-4 Long Output-model zijn enorm, variërend van uitgebreide onderzoeks- en analyseopdrachten tot de generatie van langere inhoud zoals rapporten, essays of zelfs boeken. Echter, zoals bij elke krachtige AI-technologie, zijn er ook zorgen over het mogelijke misbruik of de onbedoelde gevolgen van een dergelijk model.
Open AI als concurrent van Microsoft
Open AI als concurrent van Microsoft
Microsoft beweert deze week dat Open AI een concurrent is op het gebied van AI en zoekopdrachten. Dit is interessant omdat Microsoft beroemd is geworden door zijn investering van $13 miljard in Open AI en 49% van het bedrijf bezit.
In hun financiële verslagen hebben Microsoft bedrijven zoals Anthropic, Open AI, Meta en andere open-source aanbiedingen vermeld als concurrenten voor hun AI-aanbiedingen. Dit is vreemd om te zien, aangezien Open AI voor 49% eigendom is van Microsoft en ze ook partnerschapsovereenkomsten hebben met Meta.
Het lijkt erop dat Microsoft Open AI nu ziet als een concurrent voor hun eigen zoek- en nieuwsadvertentieactiviteiten, hoewel ze een groot belang hebben in het bedrijf. Dit is een zeer interessante dynamiek die zich heeft ontwikkeld tussen de twee bedrijven.
Open AI's ondersteuning van AI-regulering
Open AI's ondersteuning van AI-regulering
Open AI heeft deze week een aantal Senaatsvoorstellen met betrekking tot AI-regulering en -veiligheid gesteund. Dit omvat de Future of AI Innovation Act, die de United States AI Safety Institute formeel zou machtigen als een federaal orgaan om normen en richtlijnen voor AI-modellen vast te stellen.
Open AI heeft ook de NSF AI Education Act en de CREATE AI Act gesteund, die federale beurzen voor AI-onderzoek bieden en AI-onderwijsmiddelen binnen universiteiten en basisscholen opzetten.
Deze steunbetuigingen van Open AI dienen waarschijnlijk om het bedrijf een zetel aan de onderhandelingstafel te geven bij toekomstige gesprekken over AI-regulering. Als een groot AI-bedrijf is Open AI een waarschijnlijke kandidaat om in de toekomst onder regulerend toezicht te komen. Door deze wetsvoorstellen te steunen, kan Open AI de richting van de regulering helpen bepalen en ervoor zorgen dat zijn belangen worden vertegenwoordigd.
Bovendien heeft Open AI beloofd om het US AI Safety Institute vroege toegang te geven tot zijn volgende model. Dit lijkt een poging te zijn om het narratief tegen te gaan dat Open AI AI-veiligheid heeft laten prevaleren boven het ontwikkelen van krachtigere generatieve AI-technologieën.
Anthropic lanceert Claud in Brazilië
Anthropic lanceert Claud in Brazilië
Goed nieuws voor mensen in Brazilië - Anthropic heeft deze week zijn AI-assistent Claud in het land gelanceerd. Claud is nu beschikbaar voor gebruikers in Brazilië om toegang tot te krijgen en mee te interageren.
Google's Gemini 1.5 Pro en andere AI-modellen
Google's Gemini 1.5 Pro en andere AI-modellen
Google heeft deze week ook grote golven geslagen in de AI-wereld. Ze hebben een nieuwe versie van Gemini 1.5 Pro uitgebracht, die ze versie 0801 noemen en die nu beschikbaar is voor gebruik in Google's AI Studio.
Om er toegang toe te krijgen, kun je naar AI Studio .g google.com gaan en onder de "Model"-dropdown "Gemini 1.5 Pro experimental 0801" selecteren - dat is het model dat je wilt gebruiken.
Wanneer je met dit nieuwe Gemini 1.5 Pro-model praat, heeft het de leaderboard op lm.org aangevoerd, zelfs beter dan GPT-4, GPT-4 Mini, CLAE 3.5 en Sonet.
Google heeft deze week ook een nieuwe kleinere versie van hun Gemini 2-model uitgebracht - een model met 2 miljard parameters, gebouwd voor snellere prestaties en efficiëntie, waarschijnlijk voor mobiele apparaten. Interessant genoeg presteert dit 2 miljard parameter-model beter dan veel grotere modellen zoals Mixdral 8X 7B, GPT-3.5 Turbo en LLaMA 2 70 miljard.
Naast de nieuwe Gemini-modellen heeft Google deze week ook indrukwekkende nieuwe Chrome AI-functies toegevoegd, waaronder Google Lens-integratie waarmee objecten in afbeeldingen kunnen worden geïdentificeerd en doorzocht, en een nieuwe vergelijkingsfunctie waarmee producten op verschillende websites kunnen worden vergeleken.
Google's nieuwe Chrome AI-functies
Google's nieuwe Chrome AI-functies
Deze week heeft Google enkele nieuwe AI-aangedreven functies toegevoegd aan zijn Chrome-browser:
-
Google Lens in Chrome Desktop: Je kunt nu Google Lens gebruiken om informatie over objecten in afbeeldingen rechtstreeks vanuit de Chrome-browser op te zoeken. Selecteer gewoon een gebied van een afbeelding en Lens zal zoeken naar vergelijkbare producten of het object identificeren.
-
Productenvergelijking: Chrome heeft nu een ingebouwde functie waarmee je producten over verschillende tabbladen en websites kunt vergelijken. Dit maakt het gemakkelijk om producten te onderzoeken en te vergelijken zonder tussen tabbladen te hoeven schakelen.
-
Natuurlijke taal zoekgeschiedenis: Je kunt nu natuurlijke taal gebruiken om door je Chrome-browsegeschiedenis te zoeken. Je kunt bijvoorbeeld vragen "Wat was de ijssalon waar ik vorige week naar heb gekeken?" en Chrome zal de relevante informatie uit je zoekgeschiedenis ophalen.
Meta's verwijderde AI-chatbots en nieuwe AI-studio
Meta's verwijderde AI-chatbots en nieuwe AI-studio
Deze week heeft Meta één van de functies die ze vorig jaar op Meta Connect hadden aangekondigd, stopgezet. Ze hadden AI-chatbots laten zien die eruitzagen als beroemde mensen, maar dat waren niet de echte chatbots van die beroemde mensen - ze gebruikten alleen hun gezicht maar waren getraind op andere informatie. Maar niemand vond dat echt leuk, dus Meta heeft het verwijderd.
Maar ze hebben er iets anders voor in de plaats gezet - nu kan iedereen zijn eigen aangepaste AI maken. Meta heeft een AI Studio uitgerold, en één van mijn vrienden, Don Allen Stevenson, is één van de mensen die er vroege toegang toe heeft gekregen.
Deze nieuwe functie stelt iedereen in staat om op basis van hun interesses eigen AI-personages te creëren. Je kunt naar ai.meta.com/AI-Studio gaan en je eigen aangepaste AI-personage maken, waarbij je opties kunt kiezen zoals AI-huisdier, privéleraar, mede-fan, fantasierijke kunstenaar, klankbord, creatieve ontwerper, persoonlijke stylist en meer.
Het proces genereert een karakterafbeelding met AI, geeft het een naam en tagline, en dan kun je verder aanpassen en ontwerpen wat je wilt dat deze AI doet. Op dit moment lijkt het een beetje op een nieuwigheid, omdat je niet gemakkelijk grote documenten of transcripten kunt importeren om mensen te laten chatten met een AI-avatar-versie van jezelf. Maar daar proberen ze waarschijnlijk naartoe te werken in de toekomst.
Het indrukwekkendere dat Meta deze week heeft uitgebracht, is hun nieuwe Segment Anything Model 2 (SAM 2). Dit is een model dat bepaalde gedeelten van een afbeelding of video met indrukwekkende nauwkeurigheid kan segmenteren, zelfs objecten kan volgen terwijl ze zich verplaatsen. Het is een grote verbetering ten opzichte van eerdere segmentatiemodellen en kan zeer nuttig zijn voor videobewerkingstaken zoals rotoscopie. Je kunt SAM 2 uitproberen op sam2.metademolab.com.
Meta's Segment Anything Model 2
Meta's Segment Anything Model 2
Meta heeft een nieuwe versie van hun Segment Anything Model, genaamd SAM 2, uitgebracht. Dit bijgewerkte model laat aanzienlijke verbeteringen zien in zijn vermogen om objecten in afbeeldingen en video's nauwkeurig te segmenteren.
Enkele belangrijke kenmerken van SAM 2 zijn:
- Verbeterd vermogen om objecten door occlusie heen te volgen - het model kan een object blijven volgen, zelfs wanneer het tijdelijk achter een ander object verdwijnt.
- Verbeterde segmentatienauwkeurigheid, waardoor het de grenzen van gedetecteerde objecten nauwkeuriger kan omlijnden.
- Snellere verwerkingssnelheid, waardoor real-time segmentatie in video-toepassingen mogelijk is.
- Uitgebreide veelzijdigheid, waarbij het model in staat is om een breed scala aan objecten te segmenteren, van mensen en dieren tot complexere vormen en structuren.
De demo's die Meta heeft geleverd, laten de indrukwekkende mogelijkheden van SAM 2 zien. Het model kan bijvoorbeeld een skateboarder nauwkeurig volgen terwijl deze door een scene beweegt, waarbij de segmentatie zelfs wordt behouden wanneer de skateboarder achter een boom verdwijnt. Op dezelfde manier kan het meerdere ballen in een video isoleren en individueel volgen.
Perplexity Publishers Program
Perplexity Publishers Program
Perplexity, de AI-aangedreven zoekmachine, heeft het Perplexity Publishers Program aangekondigd. Dit programma heeft als doel om inkomsten te delen met specifieke partners wiens content wordt gebruikt als nieuwsbron op het Perplexity-platform.
De eerste groep partners die in dit programma zijn opgenomen, zijn:
- Time
- Der Spiegel
- Fortune
- Entrepreneur
- The Texas Tribune
- WordPress.com
Hoewel dit programma momenteel alleen grotere uitgevers omvat, heeft Perplexity de hoop uitgesproken dat het in de toekomst ook normale bloggers en content creators zal kunnen stimuleren om hun content te licenseren aan het platform. Vooralsnog is het Perplexity Publishers Program echter gericht op gevestigde nieuwsorganisaties.
Het doel van dit programma is om een manier te bieden waarop Perplexity de inkomsten kan delen die worden gegenereerd door het gebruik van partnerinhoud, in plaats van deze simpelweg te aggregeren en weer te geven zonder vergoeding. Dit vertegenwoordigt een poging van Perplexity om wederzijds voordelige relaties op te bouwen met content creators wiens werk op het platform wordt getoond.
Leonardo AI overgenomen door Canva
Leonardo AI overgenomen door Canva
Dit week is het grote nieuws dat Leonardo AI, één van de toonaangevende tools voor AI-beeldgeneratie, is overgenomen door het ontwerkvermogen Canva. Dit is een belangrijke ontwikkeling om een paar redenen:
-
Integratie met Canva: Met Leonardo AI nu onderdeel van de Canva-ecosysteem, zullen gebruikers uiteindelijk toegang krijgen tot de krachtige beeldgeneratiemogelijkheden rechtstreeks binnen het Canva-platform. Dit zal het gemakkelijker maken dan ooit om hoogwaardige, door AI gegenereerde afbeeldingen te maken zonder tussen meerdere tools te hoeven schakelen.
-
Verbeterde Canva AI: De huidige AI-beeldgeneratiemogelijkheden van Canva zijn enigszins achtergebleven in vergelijking met andere tools als DALL-E en Midjourney. Door de integratie van Leonardo's eigen "Phoenix"-model, staat de AI-beeldgeneratie van Canva op het punt om dramatisch te verbeteren, waardoor gebruikers nog indrukwekkendere visuele creaties kunnen maken.
-
Perspectief van de adviseur: De auteur merkt op dat hij meer dan een jaar lang adviseur voor Canva is geweest, dus deze overname brengt voor hem persoonlijk ook voordelen op het gebied van aandelenbelangen. Desondanks gelooft hij dat de integratie van Leonardo's technologie oprecht nuttig zal zijn, ongeacht zijn adviesrol.
-
Voortdurende innovatie: Leonardo AI zal als onafhankelijke entiteit blijven opereren, met plannen om hun eigen app en functies voortdurend bij te werken en te verbeteren. Dit betekent dat gebruikers kunnen verwachten dat er voortdurende innovatie en ontwikkeling zal plaatsvinden in het Leonardo AI-instrument, zelfs als het onderdeel wordt van het Canva-ecosysteem.
Mid Journey Update 6.1
Mid Journey Update 6.1
Deze week heeft Midjourney versie 6.1 uitgebracht, wat de beeldkwaliteit, samenhang en tekstverwerking aanzienlijk verbetert. Enkele belangrijke hoogtepunten:
-
Significante verbeteringen in beeldkwaliteit en samenhang. De getoonde voorbeelden demonstreren een hoog realiteitsgehalte dat moeilijk te onderscheiden is van echte afbeeldingen.
-
Betere verwerking van tekstpromoties, zelfs voor onzinnige of verzonnen woorden. Het model lijkt de bedoeling achter de tekst te begrijpen en genereert passende beeldvorming.
-
Een nieuw opschalingsmodel en een personaliseringsmodel dat de gegenereerde afbeeldingen verder verbetert.
Om de nieuwe Midjourney 6.1-model uit te proberen, kun je naar midjourney.com gaan, op de instellingen klikken en ervoor zorgen dat het model is ingesteld op 6.1. Daarna kun je prompts invoeren en de indrukwekkende resultaten zelf zien. De gemeenschap heeft veel opvallende voorbeelden gedeeld die de vooruitgang in deze laatste update laten zien.
Nieuwe 3D-modelgeneratoren
Nieuwe 3D-modelgeneratoren
Er zijn een paar nieuwe ontwikkelingen op het gebied van 3D-modelgeneratie met behulp
FAQ
FAQ