Cómo construir un poderoso sistema de investigación de IA multiagente
Aprende cómo construir un poderoso sistema de investigación de IA multiagente que pueda realizar investigaciones detalladas de forma autónoma sobre cualquier tema, optimizar la calidad y actualizar los hallazgos en Airtable: un tutorial paso a paso.
14 de febrero de 2025

Desbloquea el poder de la investigación impulsada por IA con este innovador sistema multiagente. Descubre cómo construir un equipo de asistentes de IA especializados que colaboren sin problemas para brindar investigación de alta calidad y basada en hechos sobre cualquier tema. Optimiza tu proceso de investigación y desbloquea nuevas posibilidades para tus proyectos empresariales o personales.
Construir un equipo de investigación de IA: Un enfoque poderoso de múltiples agentes
Evolucionar el agente de investigación: De lineal a orientado a objetivos
Superar limitaciones: Introducir agentes especializados y colaboración
Ajuste fino hecho fácil: Aprovechar el gradiente para la personalización del modelo
Orquestar el equipo de investigación: Roles, responsabilidades y coordinación
Conclusión
Construir un equipo de investigación de IA: Un enfoque poderoso de múltiples agentes
Construir un equipo de investigación de IA: Un enfoque poderoso de múltiples agentes
Los pasos clave para construir este sistema de investigación multiagente son:
-
Crear tres asistentes de GPT diferentes:
- Director: Lee y actualiza la base de datos de Airtable, desglosa las tareas de investigación y las delega al Gestor de Investigación y a los Investigadores.
- Gestor de Investigación: Genera planes de investigación, revisa y asegura la calidad de la investigación realizada por los Investigadores.
- Investigador: El agente que realmente navega por Internet, recopila información y produce los resultados de la investigación.
-
Utilizar el marco de trabajo Autogon de Anthropic:
- Autogon simplifica el uso de la API de Asistente de OpenAI al proporcionar una forma sencilla de orquestar la colaboración entre los diferentes agentes.
-
Implementar las funciones necesarias:
- Búsqueda en Google
- Raspado y resumen de sitios web
- Recuperación y actualización de registros de Airtable
-
Conectar a los agentes entre sí:
- Crear un chat grupal con el Agente Proxy del Usuario, el Investigador, el Gestor de Investigación y el Director.
- Desencadenar mensajes al grupo para iniciar el proceso de investigación.
Evolucionar el agente de investigación: De lineal a orientado a objetivos
Evolucionar el agente de investigación: De lineal a orientado a objetivos
En el pasado, mi agente de investigación era una simple cadena de modelos de lenguaje lineal que seguía un proceso muy sencillo. Podía tomar un tema de investigación, desencadenar una búsqueda en Google y dejar que un modelo de lenguaje grande eligiera los enlaces más relevantes y redactara los sitios web. El agente luego generaba un informe basado en la información recopilada. Si bien este enfoque funcionaba, se limitaba a tareas de investigación muy básicas y obvias.
Dos meses después, el agente de investigación evolucionó a un agente de IA: una combinación de un modelo de lenguaje grande, memoria y herramientas. Este agente podía razonar para descomponer un objetivo grande en subtareas y tenía acceso a varias herramientas como la API de búsqueda de Google para completar esas tareas. También tenía memoria a largo plazo para recordar sus acciones anteriores. La diferencia fundamental era que el agente de IA estaba más orientado a objetivos, lo que le permitía realizar múltiples acciones para completar una tarea de investigación, incluso con objetivos bastante ambiguos.
Esta segunda versión del agente de investigación fue una mejora significativa, entregando resultados de investigación de mayor calidad y proporcionando una lista de enlaces de referencia. Sin embargo, todavía tenía algunos problemas. La calidad de los resultados no siempre era consistente, y el agente luchaba con acciones complejas o restringidas que el modelo de OpenAI no estaba diseñado para manejar, como encontrar información de contacto específica.
Superar limitaciones: Introducir agentes especializados y colaboración
Superar limitaciones: Introducir agentes especializados y colaboración
El siguiente avance llegó con el surgimiento de sistemas multiagente como M-GPT y ChatDef. Estos sistemas tenían como objetivo mejorar el rendimiento de las tareas al introducir no solo uno, sino múltiples agentes que trabajaban juntos. Los marcos recientes como Autogon facilitaron aún más la creación de estos sistemas colaborativos, permitiendo la creación flexible de diversas jerarquías y estructuras para orquestar la cooperación entre diferentes agentes.
Con el lanzamiento de la API de Asistente de OpenAI y GPT-3, el costo de construir agentes útiles ha disminuido significativamente. Esto me impulsó a crear un Investigador de IA 3.0, donde el agente de investigación original aún realiza la investigación, pero se introduce un agente de gestor de investigación para criticar los resultados y asegurar el control de calidad. Además, se puede agregar un agente de director de investigación para descomponer los grandes objetivos de investigación en subtareas y delegarlos al gestor de investigación y a los investigadores, al mismo tiempo que se encarga de tareas como leer y escribir en una base de datos de Airtable.
Este sistema multiagente representa un cambio de paradigma en la forma en que pensamos sobre la AGI. En lugar de un solo AI que pueda hacer todas las cosas, el enfoque se centra en crear agentes especializados que puedan colaborar hacia un objetivo compartido. Este enfoque aborda los desafíos técnicos de entrenar un sistema AGI único y todopoderoso.
Ajuste fino hecho fácil: Aprovechar el gradiente para la personalización del modelo
Ajuste fino hecho fácil: Aprovechar el gradiente para la personalización del modelo
La clave para entrenar a estos agentes altamente especializados radica en dos métodos comunes: el ajuste fino y la generación aumentada por la recuperación de bases de conocimiento (RAG). El ajuste fino es útil cuando se quiere mejorar las habilidades del modelo para realizar tareas específicas, mientras que RAG es más adecuado para proporcionar a los modelos de lenguaje grandes datos precisos y actualizados.
Para hacer que el proceso de ajuste fino sea más accesible, han surgido plataformas como Gradio, que simplifican el ajuste fino de modelos de alto rendimiento de código abierto como LLaMA y Hermit. Gradio elimina la necesidad de una infraestructura y unidades de cómputo dedicadas, lo que permite a los desarrolladores y empresas ajustar los modelos con solo unas pocas líneas de código y un modelo de precios de pago por uso.
Orquestar el equipo de investigación: Roles, responsabilidades y coordinación
Orquestar el equipo de investigación: Roles, responsabilidades y coordinación
El sistema del Investigador de IA 3.0 puede ahora entregar resultados de investigación más consistentes y autónomos, con los diversos agentes colaborando para garantizar la calidad y la eficiencia.
Conclusión
Conclusión
El ajuste fino de modelos de código abierto de alto rendimiento puede ser una tarea desafiante, a menudo requiriendo hardware especializado con gran capacidad de memoria. Sin embargo, Gradient, una plataforma desarrollada por Anthropic, reduce significativamente la barrera para el ajuste fino al hacer que el proceso sea extremadamente simple y accesible para todos los desarrolladores y empresas.
Con solo unas pocas líneas de código, puedes ajustar modelos como LLaMA, Noris y Hermès utilizando Gradient. La plataforma admite varios lenguajes de programación, incluidos Node.js, Python y una interfaz de línea de comandos, y proporciona todas las herramientas y tutoriales necesarios para que puedas comenzar rápidamente.
Una de las principales ventajas de usar Gradient es su modelo de precios. Tradicionalmente, el ajuste fino requiere costos iniciales para la infraestructura y las unidades de cómputo dedicadas. Gradient, por otro lado, elimina la necesidad de infraestructura y te permite pagar solo por lo que uses, en función de un sistema basado en tokens.
La clave para construir un sistema de investigación multiagente efectivo radica en definir claramente los roles y responsabilidades de cada agente, así como en establecer un marco de coordinación sólido. En este sistema, tenemos tres agentes distintos:
-
Director de Investigación: El director es responsable de gestionar todo el proceso de investigación. Extraen la lista de empresas que se van a investigar de la base de datos de Airtable, desglosan las tareas de investigación y las delegan al Gestor de Investigación y a los Investigadores. El director también actualiza los registros de Airtable con los resultados de la investigación completada.
-
Gestor de Investigación: El gestor de investigación actúa como el guardián del control de calidad. Revisan los resultados de la investigación proporcionados por los Investigadores, brindan comentarios y aseguran que la información recopilada sea completa y esté alineada con los objetivos de investigación.
-
Investigadores: Los investigadores son los caballos de trabajo del sistema. Son responsables de llevar a cabo la investigación real, realizar búsquedas en Google, extraer los sitios web relevantes y resumir los hallazgos.
El desarrollo del sistema del investigador de IA muestra el rápido progreso en las capacidades de la IA, particularmente en las áreas de colaboración multiagente y razonamiento orientado a tareas. Los aspectos clave de este sistema incluyen:
-
Arquitectura modular de agentes: El sistema se construye utilizando un enfoque multiagente, con agentes especializados (Director, Gestor de Investigación e Investigador) que trabajan juntos para lograr la tarea de investigación. Este diseño modular permite la flexibilidad y escalabilidad.
-
Flujo de trabajo de investigación automatizado: El sistema automatiza el proceso de investigación, desde descomponer el objetivo de investigación, delegar tareas, realizar búsquedas web y resumir los hallazgos, hasta actualizar los resultados finales en la base de datos de Airtable.
-
Aseguramiento de la calidad: El agente Gestor de Investigación actúa como un mecanismo de control de calidad, brindando comentarios y presionando al agente Investigador para que encuentre información más completa y asegure resultados de investigación de alta calidad.
-
Aprovechamiento de herramientas externas: El sistema integra varios servicios externos, como la búsqueda de Google, el raspado web y Airtable, para recopilar y organizar los datos de investigación, demostrando la capacidad de utilizar un conjunto diverso de herramientas.
-
Mejora continua: El autor destaca el proceso de desarrollo iterativo, con cada versión del sistema del investigador de IA introduciendo nuevas capacidades y abordando limitaciones anteriores, como la calidad inconsistente y la gestión de la memoria.
-
Accesibilidad y escalabilidad: El uso de plataformas como Gradio para el ajuste fino de modelos y Autogon para la coordinación multiagente ayuda a reducir las barreras técnicas para que los desarrolladores construyan y desplieguen dichos sistemas.
Preguntas más frecuentes
Preguntas más frecuentes