Beheersen van complexe taken met AutoGen: Microsoft's AI-samenwerkingsraamwerk

Ontdek Microsofts krachtige AI-samenwerkingsraamwerk, AutoGen, terwijl het complexe taken aanpakt. Leer hoe workflows met meerdere agenten beter presteren dan oplossingen met één agent, waardoor nieuwe mogelijkheden worden ontgrendeld op het gebied van automatisering, softwareontwikkeling en meer.

23 april 2025

Ontgrendel de kracht van complexe taakoplossing met Microsoft's AutoGen, een state-of-the-art multi-agent framework dat eerdere single-agent oplossingen overtreft. Ontdek hoe deze innovatieve update geavanceerde taalmodeltoepassingen met verbeterde samenwerking, personalisatie en taakdecompositie mogelijkheden mogelijk maakt. Verken de mogelijkheden om verschillende processen te automatiseren en innovatieve softwareoplossingen te creëren, allemaal vanaf de comfort van uw lokale computer.

Krachtige update: Autogen's verbeterde mogelijkheden voor het oplossen van complexe taken
De kracht van multi-agent samenwerking
Autogen's prestaties op de GIAI-benchmark tonen
De probleemoplossende lus van de agenten
Toekomstplannen: Autogen's mogelijkheden verder ontwikkelen

Krachtige update: Autogen's verbeterde mogelijkheden voor het oplossen van complexe taken

De Autogen van Microsoft, een krachtig multi-agent conversatiekader, heeft een belangrijke update ontvangen die zich richt op het verbeteren van de mogelijkheid om complexe taken aan te pakken en de prestaties van de agent te verbeteren. Deze update, besproken door Adam Forna, een hoofdonderzoeker bij Microsoft Research AI, toont de effectiviteit van het gebruik van meerdere agents die samenwerken om ingewikkelde, meerstapstaken te voltooien.

De belangrijkste hoogtepunten van deze update zijn:

Verbeterde taakafronding: Het nieuwe Autogen-kader kan eerdere oplossingen met één agent op benchmarks zoals GAIA overtreffen, wat aantoont dat het beter in staat is om complexe taken aan te pakken.
Aanpasbare agent-arrangementen: Gebruikers kunnen nu aanpasbare arrangementen van agents maken die kunnen samenwerken, redeneren en verschillende hulpmiddelen gebruiken om complexe resultaten te bereiken.
Verbeterd redeneren en gebruik van hulpmiddelen: De agents binnen het Autogen-kader kunnen redeneren, plannen en hulpmiddelen gebruiken om taken uit te voeren, wat verder gaat dan alleen het genereren van tekst.
Iteratief taakoplossen: De agents volgen een lus van het toewijzen van taken, het bewaken van de voortgang en het bijwerken van hun aanpak als ze stilstand tegenkomen, waardoor ze systematischer oplossingen kunnen verkennen.
Toekomstige verbeteringen: Het Autogen-team onderzoekt mogelijkheden om nieuwe agents te introduceren die kunnen leren en zichzelf kunnen verbeteren met ervaring, visuele informatie beter kunnen begrijpen en meer pragmatische strategieën kunnen gebruiken om oplossingsruimtes te verkennen.

De kracht van multi-agent samenwerking

De nieuwe update van het Autogen-kader van Microsoft toont de effectiviteit van het gebruik van meerdere agents die samenwerken om complexe, meerstapstaken uit te voeren. Volgens Adam Forna, een hoofdonderzoeker bij Microsoft Research AI, stelt deze aanpak de agents in staat om eerdere oplossingen met één agent op benchmarks zoals GAIA te overtreffen.

De sleutel tot dit succes ligt in de mogelijkheid om aanpasbare arrangementen van agents te maken die kunnen samenwerken, redeneren en verschillende hulpmiddelen gebruiken om complexe resultaten te bereiken. Forna beschrijft agents als "zeer krachtige abstracties" die taakdecompositie, specialisatie en hulpmiddelgebruik kunnen aanpakken. Door het juiste team van agents samen te stellen, kunnen gebruikers ingewikkelde problemen effectiever aanpakken.

Het Autogen-kader, dat open-source is en beschikbaar is op GitHub, maakt het mogelijk om deze multi-agent workflows te creëren. De demo die Forna presenteerde, toont een team van vier agents: een algemene assistent, een computerterminal, een webserver en een orchestrator. Dit team was in staat om topprestaties te behalen op de GAIA-benchmark, waarbij de prestaties op de meest uitdagende vragen meer dan verdubbeld werden.

De agents volgen een gestructureerd plan, beginnend met de taakprompt en het opbouwen van een "logboek" van geverifieerde feiten, gissingen en op te zoeken informatie. Ze wijzen vervolgens taken toe aan de individuele agents, bewaken de voortgang en passen indien nodig hun aanpak aan. Deze aanpak stelt de agents in staat om te redeneren, te handelen en waar te nemen, waarbij ze gebruik maken van hun gespecialiseerde mogelijkheden om complexe problemen aan te pakken.

Voortbouwend op deze ontwikkelingen is het Autogen-team enthousiast om nieuwe mogelijkheden te verkennen, zoals het introduceren van agents die kunnen leren en zichzelf kunnen verbeteren, visuele informatie beter kunnen begrijpen en systematischer oplossingsruimtes kunnen verkennen. Door de grenzen van multi-agent samenwerking verder te verleggen, streeft Autogen ernaar om langlopende, complexe taken betrouwbaar uit te voeren met behulp van grote fundamentele modellen.

Autogen's prestaties op de GIAI-benchmark tonen

Adam Forna, een hoofdonderzoeker bij Microsoft Research AI, presenteerde het werk van het team op het gebied van het voltooien van complexe taken met behulp van multi-agent workflows in het Autogen-kader. Het doel was om langlopende, complexe taken betrouwbaar uit te voeren met behulp van grote fundamentele modellen.

Het team koos voor de aanpak van het gebruik van multi-agent workflows als platform om dit te bereiken. Agents zijn krachtige abstracties die taakdecompositie, specialisatie en hulpmiddelgebruik kunnen aanpakken. Door een team van agents samen te stellen, zoals een algemene assistent, een computerterminal, een webserver en een orchestrator, was het team in staat om topprestaties te behalen op de GIAI (General AI Assistance) benchmark.

Specifiek was het team van vier agents in staat om:

De GIAI-ranglijst aan te voeren: In maart behaalde de oplossing van het team de beste resultaten op de GIAI-ranglijst, waarbij ze eerdere oplossingen met één agent met ongeveer 8 punten overtroffen.
Aanzienlijke verbetering op de moeilijkste vragen: De oplossing van het team was in staat om de prestaties op de moeilijkste set vragen (Level 3) in de GIAI-benchmark meer dan te verdubbelen, wat volgens de auteurs "willekeurig lange sequenties van acties, gebruik van een willekeurig aantal hulpmiddelen en toegang tot de wereld in het algemeen" vereist.

De sleutel tot het succes van het team lag in het iteratieve proces dat hun agents volgden:

Produceer een logboek: De agents beginnen met het produceren van een werkgeheugen dat bestaat uit gegeven of geverifieerde feiten, feiten die moeten worden opgezocht en onderbouwde gissingen.
Taken toewijzen: De taken worden vervolgens toegewezen aan de onafhankelijke agents.
Itereren en delegeren: De agents gaan in een binnenste lus, waarbij ze controleren of ze klaar zijn of nog steeds vooruitgang boeken. Zolang ze vooruitgang boeken, delegeren ze de volgende stap naar de volgende agent.
Vastlopen aanpakken: Als de agents gedurende drie rondes geen vooruitgang meer boeken, gaan ze terug, werken ze het logboek bij, bedenken ze een nieuwe set toewijzingen en starten ze opnieuw.

Deze configuratie werkt goed voor het team, en ze zijn enthousiast over de mogelijkheden om nieuwe agents te introduceren die kunnen leren, zichzelf kunnen verbeteren, afbeeldingen en schermafdrukken beter kunnen begrijpen en de oplossingsruimte systematischer kunnen verkennen.

Het Autogen-kader is open-source en beschikbaar op GitHub, en het team moedigt iedereen aan om het te bekijken en aan de slag te gaan met deze krachtige nieuwe update.

De probleemoplossende lus van de agenten

De agents volgen een gestructureerde lus om complexe taken aan te pakken. Het proces begint met de initiële vraag of prompt, die de agents gebruiken om een "logboek" op te stellen - een werkgeheugen met gegeven of geverifieerde feiten, feiten die moeten worden opgezocht en onderbouwde gissingen.

Met het logboek op zijn plaats, wijzen de agents taken toe aan de onafhankelijke agents in het team. De agents gaan vervolgens in een binnenste lus, waarbij ze eerst controleren of de taak voltooid is. Zo niet, dan beoordelen ze of ze nog steeds vooruitgang boeken. Zolang er vooruitgang wordt geboekt, zullen de agents de volgende stap delegeren naar de juiste agent.

Als de agents echter detecteren dat ze geen vooruitgang meer boeken, maken ze daar een notitie van. Ze kunnen nog één stap delegeren, maar als de stilstand aanhoudt gedurende drie rondes, gaan ze terug, werken ze het logboek bij en bedenken ze een nieuwe set toewijzingen voor de agents, waarna het proces opnieuw wordt gestart.

Deze gestructureerde aanpak, waarbij de agents samenwerken en hun voortgang bewaken, stelt het team in staat om effectief complexe, meerstapstaken aan te pakken, waarbij ze eerdere oplossingen met één agent op benchmarks zoals de GAIA-uitdaging overtreffen.

Toekomstplannen: Autogen's mogelijkheden verder ontwikkelen

Het onderzoeksteam achter Autogen is enthousiast over de mogelijkheden om de mogelijkheden van het kader verder te verbeteren. Enkele van hun belangrijkste plannen voor de toekomst zijn:

Nieuwe agents introduceren: Het team is van plan om nieuwe agents toe te voegen die kunnen leren en zichzelf kunnen verbeteren met ervaring. Deze agents zouden een beter begrip kunnen hebben van afbeeldingen, schermafdrukken en interfaces, waardoor ze effectiever kunnen surfen op het web en hulpmiddelen kunnen gebruiken.
Systematischer verkennen verbeteren: De onderzoekers willen de agents pragmatischer maken in hun probleemoplossende strategieën. In plaats van alleen het logboek bij te werken en opnieuw te starten wanneer ze vastlopen, zullen de agents de oplossingsruimte systematischer kunnen verkennen en betere strategieën kunnen inzetten om vooruitgang te boeken.
Steeds complexere benchmarks en real-world scenario's aanpakken: Het team begint al de huidige Autogen-configuratie toe te passen op complexere benchmarks en real-world toepassingen. Ze zijn benieuwd hoe de multi-agent aanpak kan omgaan met steeds uitdagendere taken.
Samenwerking en coördinatie tussen agents verbeteren: De onderzoekers willen manieren verkennen om de samenwerking en coördinatie tussen de agents te verbeteren, zodat ze effectiever kunnen samenwerken om complexe, meerstapstaken uit te voeren.
Logboekbeheer en besluitvorming verbeteren: Het team zal zich richten op het verfijnen van het logboekbeheersysteem en de besluitvormingsprocessen die door de agents worden gebruikt, om ervoor te zorgen dat ze meer geïnformeerde en efficiënte keuzes kunnen maken tijdens de taakafronding.

Door deze toekomstige plannen na te streven, wil het Autogen-onderzoeksteam de mogelijkheden van het kader verder verbeteren, waardoor het een nog krachtiger instrument wordt voor het aanpakken van complexe, real-world problemen door middel van samenwerkende, multi-agent systemen.

FAQ

Wat is AutoGen?

Wat zijn de belangrijkste kenmerken van de nieuwe AutoGen-update?

Hoe kan ik aan de slag gaan met de nieuwe AutoGen-update?

Wat zijn de potentiële toepassingen van de nieuwe AutoGen-update?

Hoe verbetert de multi-agent aanpak in AutoGen de prestaties op complexe taken?

Creëer uw AI-vriendin

Bouw uw ideale metgezel met onze AI Girlfriend Builder