Dominando Tarefas Complexas com o AutoGen: Estrutura de Colaboração de IA da Microsoft

Descubra o poderoso framework de colaboração de IA da Microsoft, o AutoGen, à medida que ele enfrenta tarefas complexas. Aprenda como os fluxos de trabalho de vários agentes superam as soluções de agente único, desbloqueando novas possibilidades em automação, desenvolvimento de software e muito mais.

21 de fevereiro de 2025

party-gif

Desbloqueie o poder da resolução de tarefas complexas com o AutoGen da Microsoft, uma estrutura multiagente de ponta que supera as soluções anteriores de agente único. Descubra como essa atualização inovadora permite aplicativos sofisticados de modelos de linguagem em larga escala com capacidades aprimoradas de colaboração, personalização e decomposição de tarefas. Explore o potencial de automatizar vários processos e criar soluções de software inovadoras, tudo a partir da comodidade do seu computador local.

Atualização Poderosa: Capacidades Aprimoradas do Autogen para Resolução de Tarefas Complexas

O Autogen da Microsoft, uma poderosa estrutura de conversação multiagente, recebeu uma atualização significativa focada em melhorar sua capacidade de lidar com tarefas complexas e melhorar o desempenho dos agentes. Esta atualização, discutida por Adam Forna, um pesquisador principal da Microsoft Research AI, demonstra a eficácia do uso de múltiplos agentes trabalhando de forma colaborativa para concluir tarefas intrincadas de várias etapas.

Os principais destaques desta atualização incluem:

  1. Melhoria na Conclusão de Tarefas: A nova estrutura Autogen pode superar soluções anteriores de agente único em benchmarks como o GAIA, demonstrando sua capacidade de lidar com tarefas complexas de forma mais eficaz.

  2. Arranjos de Agentes Personalizáveis: Os usuários agora podem criar arranjos personalizáveis de agentes que podem colaborar, raciocinar e utilizar várias ferramentas para alcançar resultados complexos.

  3. Raciocínio Aprimorado e Uso de Ferramentas: Os agentes dentro da estrutura Autogen têm a capacidade de raciocinar, planejar e utilizar ferramentas para concluir tarefas, indo além da simples geração de texto.

  4. Resolução de Tarefas de Forma Iterativa: Os agentes seguem um loop de atribuição de tarefas, monitoramento do progresso e atualização de sua abordagem se encontrarem estagnação, permitindo uma exploração mais sistemática das soluções.

  5. Melhorias Futuras: A equipe do Autogen está explorando oportunidades para introduzir novos agentes que possam aprender e se aprimorar com a experiência, entender melhor as informações visuais e empregar estratégias mais pragmáticas para explorar os espaços de solução.

O Poder da Colaboração Multi-Agente

A nova atualização da estrutura Autogen da Microsoft demonstra a eficácia do uso de múltiplos agentes trabalhando juntos para concluir tarefas complexas e de várias etapas. De acordo com Adam Forna, um pesquisador principal da Microsoft Research AI, essa abordagem permite que os agentes superem soluções anteriores de agente único em benchmarks como o GAIA.

A chave para esse sucesso reside na capacidade de criar arranjos personalizáveis de agentes que podem colaborar, raciocinar e utilizar várias ferramentas para alcançar resultados complexos. Forna descreve os agentes como "abstrações muito poderosas" que podem lidar com a decomposição de tarefas, especialização e uso de ferramentas. Ao montar a equipe certa de agentes, os usuários podem abordar problemas intrincados de forma mais eficaz.

A estrutura Autogen, que é de código aberto e está disponível no GitHub, permite a criação desses fluxos de trabalho multiagente. A demonstração apresentada por Forna mostra uma equipe de quatro agentes: um assistente geral, um terminal de computador, um servidor web e um orquestrador. Essa equipe conseguiu alcançar os melhores resultados no benchmark GAIA, mais que dobrando o desempenho nas questões mais desafiadoras.

Os agentes seguem um plano estruturado, começando com o prompt da tarefa e construindo um "livro razão" de fatos verificados, suposições e informações a serem pesquisadas. Eles então delegam tarefas aos agentes individuais, monitorando o progresso e iterando se necessário. Essa abordagem permite que os agentes raciocinem, ajam e observem, aproveitando suas capacidades especializadas para lidar com problemas complexos.

De agora em diante, a equipe do Autogen está entusiasmada em explorar oportunidades para melhorias adicionais, como a introdução de agentes que possam aprender e se aprimorar, entender melhor as informações visuais e explorar os espaços de solução de forma mais sistemática. Ao continuar a empurrar as fronteiras da colaboração multiagente, o Autogen visa concluir de forma confiável tarefas complexas e de longa duração usando modelos fundamentais de grande porte.

Demonstrando o Desempenho do Autogen no Benchmark GIAI

Adam Forna, um pesquisador principal da Microsoft Research AI, apresentou o trabalho da equipe na conclusão de tarefas complexas usando fluxos de trabalho multiagente na estrutura Autogen. O objetivo era concluir de forma confiável tarefas complexas e de longa duração usando modelos fundamentais de grande porte.

A equipe adotou a abordagem de usar fluxos de trabalho multiagente como plataforma para alcançar isso. Os agentes são abstrações poderosas que podem lidar com a decomposição de tarefas, especialização e uso de ferramentas. Ao montar uma equipe de agentes, como um assistente geral, um terminal de computador, um servidor web e um orquestrador, a equipe conseguiu alcançar o estado da arte no desempenho no benchmark GIAI (General AI Assistance).

Especificamente, o fluxo de trabalho de quatro agentes da equipe conseguiu:

  1. Liderar o Ranking do GIAI: Em março, a solução da equipe alcançou os melhores resultados no ranking do GIAI, superando soluções anteriores de agente único em cerca de 8 pontos.

  2. Melhorar Significativamente nas Questões Mais Difíceis: A solução da equipe conseguiu mais que dobrar o desempenho no conjunto mais difícil de questões (Nível 3) no benchmark GIAI, que os autores descreveram como exigindo "sequências arbitrariamente longas de ações, uso de qualquer número de ferramentas e acesso ao mundo em geral".

A chave para o sucesso da equipe foi o processo iterativo seguido por seus agentes:

  1. Produzir um Livro Razão: Os agentes começam produzindo uma memória de trabalho que consiste em fatos dados ou verificados, fatos que precisam ser pesquisados e suposições fundamentadas.
  2. Atribuir Tarefas: As tarefas são então atribuídas aos agentes independentes.
  3. Iterar e Delegar: Os agentes entram em um loop interno, verificando se terminaram ou ainda estão progredindo. Desde que estejam progredindo, eles delegam a próxima etapa para o próximo agente.
  4. Lidar com Estagnações: Se os agentes não estiverem progredindo por três rodadas, eles voltam, atualizam o Livro Razão, criam um novo conjunto de atribuições e recomeçam.

Essa configuração tem funcionado bem para a equipe, e eles estão entusiasmados com as oportunidades de introduzir novos agentes que possam aprender, se aprimorar, entender melhor imagens e capturas de tela e explorar o espaço de solução de forma mais sistemática.

A estrutura Autogen é de código aberto e está disponível no GitHub, e a equipe incentiva a todos a conferir e começar a usar essa poderosa nova atualização.

O Ciclo de Resolução de Problemas dos Agentes

Os agentes seguem um loop estruturado para lidar com tarefas complexas. O processo começa com a pergunta ou prompt inicial, que os agentes usam para produzir um "livro razão" - uma memória de trabalho contendo fatos dados ou verificados, fatos que precisam ser pesquisados e suposições fundamentadas.

Com o livro razão estabelecido, os agentes atribuem tarefas aos agentes independentes da equipe. Os agentes então entram em um loop interno, onde primeiro verificam se a tarefa está concluída. Caso contrário, eles avaliam se ainda estão progredindo. Desde que estejam progredindo, os agentes delegarão a próxima etapa para o agente apropriado.

No entanto, se os agentes detectarem que não estão mais progredindo, eles anotarão isso. Eles ainda podem delegar mais uma etapa, mas se a estagnação persistir por três rodadas, eles voltarão, atualizarão o livro razão e criarão um novo conjunto de atribuições para os agentes, reiniciando o processo.

Essa abordagem estruturada, com os agentes colaborando e monitorando seu progresso, permite que a equipe lide com tarefas complexas e de várias etapas de forma eficaz, superando soluções anteriores de agente único em benchmarks como o desafio GAIA.

Planos Futuros: Avançando as Capacidades do Autogen

A equipe de pesquisa por trás do Autogen está entusiasmada com as oportunidades de aprimorar ainda mais as capacidades da estrutura. Alguns de seus principais planos para o futuro incluem:

  1. Introdução de Novos Agentes: A equipe está buscando adicionar novos agentes que possam aprender e se aprimorar com a experiência. Esses agentes poderiam ter uma melhor compreensão de imagens, capturas de tela e interfaces, permitindo um uso mais eficaz da web e de ferramentas.

  2. Melhoria da Exploração Sistemática: Os pesquisadores querem tornar os agentes mais pragmáticos em suas estratégias de resolução de problemas. Em vez de apenas atualizar o livro razão e reiniciar quando ficarem presos, os agentes poderão explorar o espaço de solução de forma mais sistemática, empregando melhores estratégias para progredir.

  3. Lidar com Benchmarks e Cenários do Mundo Real Cada Vez Mais Complexos: A equipe já está começando a aplicar a configuração atual do Autogen para lidar com benchmarks mais complexos e casos de uso do mundo real. Eles estão ansiosos para ver como a abordagem multiagente pode lidar com tarefas cada vez mais desafiadoras.

  4. Aprimorar a Colaboração e Coordenação entre Agentes: Os pesquisadores pretendem explorar maneiras de melhorar a colaboração e a coordenação entre os agentes, permitindo que eles trabalhem juntos de forma mais eficaz para concluir tarefas complexas e de várias etapas.

  5. Melhorar o Gerenciamento do Livro Razão e a Tomada de Decisão: A equipe se concentrará no refinamento do sistema de gerenciamento do livro razão e nos processos de tomada de decisão utilizados pelos agentes, garantindo que eles possam tomar decisões mais informadas e eficientes durante a conclusão das tarefas.

Ao perseguir esses planos futuros, a equipe de pesquisa do Autogen visa avançar ainda mais as capacidades da estrutura, tornando-a uma ferramenta ainda mais poderosa para lidar com problemas complexos do mundo real por meio do uso de sistemas colaborativos e multiagente.

Perguntas frequentes