Dominar tareas complejas con AutoGen: el marco de colaboración de IA de Microsoft
Descubre el poderoso marco de colaboración de IA de Microsoft, AutoGen, mientras aborda tareas complejas. Aprende cómo los flujos de trabajo de múltiples agentes superan a las soluciones de un solo agente, desbloqueando nuevas posibilidades en automatización, desarrollo de software y más allá.
21 de febrero de 2025

Desbloquea el poder de la resolución de tareas complejas con AutoGen de Microsoft, un marco de trabajo de múltiples agentes de vanguardia que supera a las soluciones anteriores de un solo agente. Descubre cómo esta innovadora actualización permite aplicaciones sofisticadas de modelos de lenguaje a gran escala con capacidades mejoradas de colaboración, personalización y descomposición de tareas. Explora el potencial para automatizar diversos procesos y crear soluciones de software innovadoras, todo desde la comodidad de tu computadora local.
Poderosa actualización: Capacidades mejoradas de Autogen para la resolución de tareas complejas
El poder de la colaboración multiagente
Mostrando el rendimiento de Autogen en el punto de referencia GIAI
El bucle de resolución de problemas de los agentes
Planes futuros: Avanzar en las capacidades de Autogen
Poderosa actualización: Capacidades mejoradas de Autogen para la resolución de tareas complejas
Poderosa actualización: Capacidades mejoradas de Autogen para la resolución de tareas complejas
El Autogen de Microsoft, un poderoso marco de trabajo de conversación multiagente, ha recibido una actualización significativa centrada en mejorar su capacidad para manejar tareas complejas y mejorar el rendimiento de los agentes. Esta actualización, discutida por Adam Forna, un investigador principal de Microsoft Research AI, muestra la eficacia de utilizar múltiples agentes que trabajan de manera colaborativa para completar tareas intrincadas de varios pasos.
Los aspectos más destacados de esta actualización incluyen:
-
Mejora en la finalización de tareas: El nuevo marco de trabajo Autogen puede superar a las soluciones anteriores de un solo agente en puntos de referencia como GAIA, demostrando su capacidad para abordar tareas complejas de manera más efectiva.
-
Arreglos de agentes personalizables: Los usuarios ahora pueden crear arreglos personalizables de agentes que pueden colaborar, razonar y utilizar varias herramientas para lograr resultados complejos.
-
Razonamiento y uso de herramientas mejorados: Los agentes dentro del marco de trabajo Autogen tienen la capacidad de razonar, planificar y utilizar herramientas para completar tareas, yendo más allá de simplemente generar texto.
-
Resolución de tareas iterativa: Los agentes siguen un ciclo de asignación de tareas, monitoreo del progreso y actualización de su enfoque si se encuentran con un estancamiento, lo que permite una exploración más sistemática de las soluciones.
-
Mejoras futuras: El equipo de Autogen está explorando oportunidades para introducir nuevos agentes que puedan aprender y mejorar por sí mismos con la experiencia, comprender mejor la información visual y emplear estrategias más pragmáticas para explorar los espacios de solución.
Esta actualización de Autogen muestra el poder de la colaboración multiagente para abordar tareas complejas y del mundo real, convirtiéndolo en una herramienta valiosa para desarrolladores, investigadores y empresas que buscan automatizar y agilizar diversos procesos.
El poder de la colaboración multiagente
El poder de la colaboración multiagente
La nueva actualización del marco de trabajo Autogen de Microsoft muestra la eficacia de utilizar múltiples agentes que trabajan juntos para completar tareas complejas y de varios pasos. Según Adam Forna, un investigador principal de Microsoft Research AI, este enfoque permite que los agentes superen a las soluciones anteriores de un solo agente en puntos de referencia como GAIA.
La clave de este éxito radica en la capacidad de crear arreglos personalizables de agentes que pueden colaborar, razonar y utilizar varias herramientas para lograr resultados complejos. Forna describe a los agentes como "abstracciones muy poderosas" que pueden manejar la descomposición de tareas, la especialización y el uso de herramientas. Al ensamblar el equipo adecuado de agentes, los usuarios pueden abordar problemas intrincados de manera más efectiva.
El marco de trabajo Autogen, que es de código abierto y está disponible en GitHub, permite la creación de estos flujos de trabajo multiagente. La demostración presentada por Forna muestra un equipo de cuatro agentes: un asistente general, una terminal de computadora, un servidor web y un orquestador. Este equipo logró obtener los mejores resultados en el punto de referencia GAIA, más que duplicando el rendimiento en las preguntas más desafiantes.
Los agentes siguen un plan estructurado, comenzando con el mensaje de la tarea y construyendo un "libro mayor" de hechos verificados, suposiciones y información a consultar. Luego delegan tareas a los agentes individuales, monitorean el progreso y iteran si es necesario. Este enfoque permite que los agentes razonen, actúen y observen, aprovechando sus capacidades especializadas para abordar problemas complejos.
En el futuro, el equipo de Autogen está emocionado de explorar oportunidades para mejoras adicionales, como introducir agentes que puedan aprender y mejorar por sí mismos, comprender mejor la información visual y explorar los espacios de solución de manera más sistemática. Al continuar empujando los límites de la colaboración multiagente, Autogen tiene como objetivo lograr de manera confiable tareas complejas y de larga duración utilizando modelos fundamentales de gran tamaño.
Mostrando el rendimiento de Autogen en el punto de referencia GIAI
Mostrando el rendimiento de Autogen en el punto de referencia GIAI
Adam Forna, un investigador principal de Microsoft Research AI, presentó el trabajo del equipo para completar tareas complejas utilizando flujos de trabajo multiagente en el marco de trabajo Autogen. El objetivo era lograr de manera confiable tareas complejas y de larga duración utilizando modelos fundamentales de gran tamaño.
El equipo adoptó el enfoque de utilizar flujos de trabajo multiagente como plataforma para lograr esto. Los agentes son abstracciones poderosas que pueden manejar la descomposición de tareas, la especialización y el uso de herramientas. Al ensamblar un equipo de agentes, como un asistente general, una terminal de computadora, un servidor web y un orquestador, el equipo logró un rendimiento de vanguardia en el punto de referencia GIAI (Asistencia de Inteligencia Artificial General).
Específicamente, el flujo de trabajo de cuatro agentes del equipo pudo:
-
Encabezar el Ranking de GIAI: En marzo, la solución del equipo logró los mejores resultados en el ranking de GIAI, superando a las soluciones anteriores de un solo agente en aproximadamente 8 puntos.
-
Mejorar significativamente en las preguntas más difíciles: La solución del equipo pudo más que duplicar el rendimiento en el conjunto más difícil de preguntas (Nivel 3) en el punto de referencia GIAI, que los autores describieron como que requiere "secuencias de acciones arbitrariamente largas, uso de cualquier número de herramientas y acceso al mundo en general".
La clave del éxito del equipo fue el proceso iterativo que siguieron sus agentes:
- Producir un Libro Mayor: Los agentes comienzan produciendo una memoria de trabajo que consta de hechos dados o verificados, hechos que deben consultarse y suposiciones fundamentadas.
- Asignar Tareas: Luego se asignan las tareas a los agentes independientes.
- Iterar y Delegar: Los agentes entran en un ciclo interno, verificando si han terminado o si aún están progresando. Mientras sigan progresando, delegan el siguiente paso al siguiente agente.
- Manejar Estancamientos: Si los agentes no están progresando durante tres rondas, vuelven atrás, actualizan el Libro Mayor, proponen un nuevo conjunto de asignaciones y comienzan de nuevo.
Esta configuración ha funcionado bien para el equipo, y están emocionados por las oportunidades de introducir nuevos agentes que puedan aprender, mejorar por sí mismos, comprender mejor las imágenes y capturas de pantalla, y explorar el espacio de solución de manera más sistemática.
El marco de trabajo Autogen es de código abierto y está disponible en GitHub, y el equipo anima a todos a revisarlo y comenzar a usar esta poderosa nueva actualización.
El bucle de resolución de problemas de los agentes
El bucle de resolución de problemas de los agentes
Los agentes siguen un ciclo estructurado para abordar tareas complejas. El proceso comienza con la pregunta o mensaje inicial, que los agentes utilizan para producir un "libro mayor", una memoria de trabajo que contiene hechos dados o verificados, hechos que deben consultarse y suposiciones fundamentadas.
Con el libro mayor en su lugar, los agentes asignan tareas a los agentes independientes del equipo. Los agentes luego entran en un ciclo interno, donde primero verifican si la tarea está completa. Si no es así, evalúan si aún están progresando. Mientras sigan progresando, los agentes delegarán el siguiente paso al agente apropiado.
Sin embargo, si los agentes detectan que ya no están progresando, lo registran. Aún pueden delegar un paso más, pero si el estancamiento persiste durante tres rondas, volverán atrás, actualizarán el libro mayor y propondrán un nuevo conjunto de asignaciones para los agentes, reiniciando el proceso.
Este enfoque estructurado, con los agentes colaborando y monitoreando su progreso, permite que el equipo aborde tareas complejas y de varios pasos de manera efectiva, superando a las soluciones anteriores de un solo agente en puntos de referencia como el desafío GAIA.
Planes futuros: Avanzar en las capacidades de Autogen
Planes futuros: Avanzar en las capacidades de Autogen
El equipo de investigación detrás de Autogen está emocionado por las oportunidades para mejorar aún más las capacidades del marco de trabajo. Algunos de sus planes clave para el futuro incluyen:
-
Introducir Nuevos Agentes: El equipo está buscando agregar nuevos agentes que puedan aprender y mejorar por sí mismos con la experiencia. Estos agentes podrían tener una mejor comprensión de imágenes, capturas de pantalla e interfaces, lo que permitiría un uso más efectivo de la navegación web y las herramientas.
-
Mejorar la Exploración Sistemática: Los investigadores quieren que los agentes sean más pragmáticos en sus estrategias de resolución de problemas. En lugar de simplemente actualizar el libro mayor y reiniciar cuando se atascan, los agentes podrán explorar el espacio de solución de manera más sistemática, empleando mejores estrategias para progresar.
-
Abordar Puntos de Referencia y Escenarios del Mundo Real Cada Vez Más Complejos: El equipo ya está comenzando a aplicar la configuración actual de Autogen para abordar puntos de referencia más complejos y casos de uso del mundo real. Están ansiosos por ver cómo el enfoque multiagente puede manejar tareas cada vez más desafiantes.
-
Mejorar la Colaboración y Coordinación entre Agentes: Los investigadores planean explorar formas de mejorar la colaboración y coordinación entre los agentes, permitiéndoles trabajar juntos de manera más efectiva para completar tareas complejas y de varios pasos.
-
Mejorar la Gestión del Libro Mayor y la Toma de Decisiones: El equipo se centrará en refinar el sistema de gestión del libro mayor y los procesos de toma de decisiones utilizados por los agentes, asegurando que puedan tomar decisiones más informadas y eficientes durante la finalización de las tareas.
Al perseguir estos planes futuros, el equipo de investigación de Autogen tiene como objetivo avanzar aún más en las capacidades del marco de trabajo, convirtiéndolo en una herramienta aún más poderosa para abordar problemas complejos y del mundo real a través del uso de sistemas colaborativos y multiagente.
Preguntas más frecuentes
Preguntas más frecuentes