Wie man ein leistungsfähiges Multi-Agenten-KI-Forschungssystem aufbaut

Erfahren Sie, wie Sie ein leistungsfähiges Multi-Agenten-KI-Forschungssystem aufbauen, das eigenständig detaillierte Forschungen zu jedem Thema durchführen, die Qualität optimieren und die Ergebnisse in Airtable aktualisieren kann - eine Schritt-für-Schritt-Anleitung.

15. Februar 2025

party-gif

Erschließen Sie die Kraft der KI-gesteuerten Forschung mit diesem innovativen Multi-Agenten-System. Erfahren Sie, wie Sie ein Team spezialisierter KI-Assistenten aufbauen, die nahtlos zusammenarbeiten, um hochwertige, faktenbasierte Forschung zu jedem Thema zu liefern. Optimieren Sie Ihren Forschungsprozess und erschließen Sie neue Möglichkeiten für Ihre Geschäfts- oder Privatprojekte.

Aufbau eines KI-Forschungsteams: Ein leistungsfähiger Multi-Agenten-Ansatz

Die Schlüsselschritte beim Aufbau dieses Multi-Agenten-Forschungssystems sind:

  1. Erstellen Sie drei verschiedene GPT-Assistenten:

    • Direktor: Liest und aktualisiert die Airtable-Datenbank, zerlegt Forschungsaufgaben und delegiert sie an den Forschungsmanager und die Forscher.
    • Forschungsmanager: Erstellt Forschungspläne, überprüft und stellt die Qualitätssicherung für die von den Forschern gelieferte Forschung sicher.
    • Forscher: Der Agent, der tatsächlich das Internet durchsucht, Informationen sammelt und die Forschungsergebnisse erstellt.
  2. Verwenden Sie das Autogon-Framework von Anthropic:

    • Autogon vereinfacht die Verwendung der OpenAI-Assistenten-API, indem es eine unkomplizierte Möglichkeit bietet, die Zusammenarbeit zwischen den verschiedenen Agenten zu orchestrieren.
  3. Implementieren Sie die notwendigen Funktionen:

    • Google-Suche
    • Website-Scraping und -Zusammenfassung
    • Airtable-Datensatzabruf und -aktualisierung
  4. Verbinden Sie die Agenten miteinander:

    • Erstellen Sie einen Gruppenchat mit dem User Proxy Agent, dem Forscher, dem Forschungsmanager und dem Direktor.
    • Lösen Sie Nachrichten an die Gruppe aus, um den Forschungsprozess zu initiieren.

Das Ergebnis ist ein leistungsfähiges, autonomes Forschungssystem, das komplexe Forschungsaufgaben bewältigen kann, indem es die spezialisierten Fähigkeiten mehrerer Agenten nutzt, die zusammenarbeiten. Dieser Ansatz stellt einen Paradigmenwechsel dar, wie wir über AGI nachdenken, weg von der Idee einer einzelnen, allmächtigen KI hin zu einem kollaborativen System spezialisierter Agenten.

Weiterentwicklung des Forschungsagenten: Von linear zu zielorientiert

In der Vergangenheit war mein Forschungsagent eine einfache lineare Sprachmodellkette, die einem sehr geraden Prozess folgte. Er konnte ein Forschungsthema aufnehmen, eine Google-Suche auslösen und einem großen Sprachmodell die Auswahl der relevantesten Links und das Skripten der Websites überlassen. Der Agent würde dann auf der Grundlage der gesammelten Informationen einen Bericht erstellen. Obwohl dieser Ansatz funktionierte, war er auf sehr grundlegende und offensichtliche Forschungsaufgaben beschränkt.

Zwei Monate später entwickelte sich der Forschungsagent zu einem KI-Agenten - einer Kombination aus einem großen Sprachmodell, Speicher und Werkzeugen. Dieser Agent konnte logisch denken, um ein großes Ziel in Teilaufgaben zu zerlegen, und hatte Zugriff auf verschiedene Werkzeuge wie die Google-Suche-API, um diese Aufgaben zu erfüllen. Er hatte auch ein Langzeitgedächtnis, um seine vorherigen Aktionen zu erinnern. Der grundlegende Unterschied war, dass der KI-Agent zielorientierter war und in der Lage war, mehrere Aktionen auszuführen, um eine Forschungsaufgabe zu erfüllen, auch bei ziemlich unklaren Zielen.

Die zweite Version des Forschungsagenten war eine erhebliche Verbesserung, da sie hochwertigere Forschungsergebnisse lieferte und eine Liste von Referenzlinks bereitstellte. Sie hatte jedoch immer noch einige Probleme. Die Qualität der Ergebnisse war nicht immer konsistent, und der Agent hatte Schwierigkeiten mit komplexen oder eingeschränkten Aktionen, die das OpenAI-Modell nicht konzipiert war zu bewältigen, wie das Auffinden bestimmter Kontaktinformationen.

Der nächste Durchbruch kam mit dem Aufkommen von Multi-Agenten-Systemen wie M-GPT und ChatDef. Diese Systeme zielten darauf ab, die Aufgabenleistung zu verbessern, indem sie nicht nur einen, sondern mehrere Agenten einführten, die zusammenarbeiten. Die jüngsten Frameworks wie Autogon machten die Erstellung dieser kollaborativen Systeme noch einfacher, indem sie die flexible Erstellung verschiedener Hierarchien und Strukturen zur Orchestrierung der Zusammenarbeit zwischen verschiedenen Agenten ermöglichten.

Mit der Veröffentlichung der OpenAI-Assistenten-API und GPT-3 sind die Kosten für den Aufbau nützlicher Agenten deutlich gesunken. Dies veranlasste mich, einen KI-Forscher 3.0 zu erstellen, bei dem der ursprüngliche Forschungsagent immer noch die Forschung durchführt, aber ein Forschungsmanager-Agent eingeführt wird, um die Ergebnisse zu kritisieren und die Qualitätskontrolle sicherzustellen. Zusätzlich kann ein Forschungsdirektor-Agent hinzugefügt werden, um große Forschungsziele in Teilaufgaben zu zerlegen und sie an den Forschungsmanager und die Forscher zu delegieren, während er auch Aufgaben wie das Lesen und Schreiben in einer Airtable-Datenbank übernimmt.

Dieses Multi-Agenten-System stellt einen Paradigmenwechsel dar, wie wir über AGI nachdenken. Anstelle einer einzelnen KI, die alles kann, liegt der Fokus darauf, spezialisierte Agenten zu schaffen, die an einem gemeinsamen Ziel zusammenarbeiten. Dieser Ansatz adressiert die technischen Herausforderungen beim Training eines einzelnen, allmächtigen AGI-Systems.

Der Schlüssel zum Training dieser hochspezialisierten Agenten liegt in zwei gängigen Methoden: Fine-Tuning und Knowledge-Base-Retrieval-Augmented Generation (RAG). Fine-Tuning ist nützlich, wenn Sie das Modell in der Ausführung bestimmter Aufgaben verbessern möchten, während RAG besser geeignet ist, um große Sprachmodelle mit genauen und aktuellen Daten zu versorgen.

Um den Fine-Tuning-Prozess zugänglicher zu machen, sind Plattformen wie Gradio entstanden, die das Fine-Tuning von leistungsfähigen Open-Source-Modellen wie LLaMA und Hermit vereinfachen. Gradio beseitigt die Notwendigkeit dedizierter Infrastruktur und Recheneinheiten und ermöglicht es Entwicklern und Unternehmen, Modelle mit nur wenigen Zeilen Code und einem Pay-as-you-go-Preismodell nachzuschulen.

Durch die Nutzung dieser Fortschritte kann das KI-Forscher-System 3.0 nun konsistentere und autonomere Forschungsergebnisse liefern, wobei die verschiedenen Agenten zusammenarbeiten, um Qualität und Effizienz sicherzustellen.

Überwindung von Einschränkungen: Einführung spezialisierter Agenten und Zusammenarbeit

Die Anfangsversionen des KI-Forschers hatten Einschränkungen wie einen linearen Ablauf und eine inkonsistente Qualität. Um diese Probleme anzugehen, erkundete der Autor den Einsatz von KI-Agenten - einer Kombination aus großen Sprachmodellen, Speicher und Werkzeugen. Dies ermöglichte eine zielorientierte Forschung, bei der der Agent eine Aufgabe in Teilaufgaben zerlegen und verschiedene Werkzeuge zur Erledigung der Forschung nutzen konnte.

Die Einführung von Multi-Agenten-Systemen wie M8GT und ChatDef verbesserte die Aufgabenleistung weiter, indem mehrere Agenten zusammenarbeiteten. Die jüngsten Frameworks wie Anthropics Autogen machten die Erstellung dieser kollaborativen Systeme noch einfacher und ermöglichten die Entwicklung flexibler Hierarchien und Strukturen zur Orchestrierung der Zusammenarbeit zwischen verschiedenen Agenten.

Der Autor entschied sich dann, einen KI-Forscher 3.0 zu erstellen, bei dem sich der ursprüngliche Forschungsagent auf die eigentliche Forschung konzentriert, während ein Forschungsmanager-Agent eingeführt wird, um die Ergebnisse zu kritisieren und die Qualitätskontrolle sicherzustellen. Zusätzlich wurde ein Forschungsdirektor-Agent hinzugefügt, um die Forschungsziele in Teilaufgaben zu zerlegen und an den Forschungsmanager und die Forscheragenten zu delegieren. Dieser Multi-Agenten-Ansatz führte zu einer konsistenteren Forschungsqualität und einem autonomeren System.

Der Autor erörterte auch die beiden gängigen Methoden zum Training spezialisierter Agenten: Fine-Tuning und Knowledge-Base-Retrieval-Augmented Generation (RAG). Während das Fine-Tuning die Modellfertigkeiten in bestimmten Aufgaben verbessern kann, kann es eine Herausforderung sein und spezialisierte Hardware erfordern. Der Autor hob Anthropics Gradio-Plattform als ein Werkzeug hervor, das den Fine-Tuning-Prozess vereinfacht und für Entwickler und Unternehmen zugänglich macht.

Abschließend gab der Autor eine Schritt-für-Schritt-Anleitung zum Aufbau dieses Multi-Agenten-Forschungssystems unter Verwendung von Autogen, was die Flexibilität und Leistungsfähigkeit dieses Ansatzes bei der Erstellung autonomer und kollaborativer KI-Systeme demonstriert.

Einfaches Feintuning: Ausnutzen des Gradienten für die Modellpersonalisierung

Das Fine-Tuning von leistungsfähigen Open-Source-Modellen kann eine Herausforderung sein und oft spezialisierte Hardware mit großer Speicherkapazität erfordern. Gradient, eine von Anthropic entwickelte Plattform, reduziert die Hürden für das Fine-Tuning jedoch erheblich, indem es den Prozess extrem einfach und für alle Entwickler und Unternehmen zugänglich macht.

Mit nur wenigen Zeilen Code können Sie Modelle wie LLaMA, Noris und Hermès mit Gradient nachschulen. Die Plattform unterstützt mehrere Programmiersprachen, darunter Node.js, Python und eine Befehlszeilenschnittstelle, und bietet alle erforderlichen Tools und Tutorials, um schnell loszulegen.

Einer der Hauptvorteile der Verwendung von Gradient ist sein Preismodell. Traditionell erfordert das Fine-Tuning Vorabkosten für dedizierte Infrastruktur und Recheneinheiten. Gradient hingegen beseitigt die Notwendigkeit von Infrastruktur und ermöglicht es Ihnen, nur für das zu bezahlen, was Sie nutzen, basierend auf einem tokenbasierten System.

Wenn Sie auf den Link in der Beschreibung unten klicken, erhalten Sie 5 US-Dollar an kostenlosen Guthaben, um mit Gradient loszulegen. Dies kann besonders hilfreich sein, wenn Sie Modelle nachschulen müssen, aber nicht wissen, wo Sie anfangen sollen. Gradients benutzerfreundliche Plattform und umfassende Ressourcen machen den Prozess nahtlos, sodass Sie sich auf Ihre spezifischen Anwendungsfälle und Anforderungen konzentrieren können.

Orchestrierung des Forschungsteams: Rollen, Verantwortlichkeiten und Koordination

Der Schlüssel zum Aufbau eines effektiven Multi-Agenten-Forschungssystems liegt in der klaren Definition der Rollen und Verantwortlichkeiten jedes Agenten sowie in der Etablierung eines robusten Koordinationsrahmens. In diesem System haben wir drei distinkte Agenten:

  1. Forschungsdirektor: Der Direktor ist für das Management des gesamten Forschungsprozesses verantwortlich. Er extrahiert die Liste der zu erforschenden Unternehmen aus der Airtable-Datenbank, zerlegt die Forschungsaufgaben und delegiert sie an den Forschungsmanager und die Forscher. Der Direktor aktualisiert auch die Airtable-Datensätze mit den abgeschlossenen Forschungsergebnissen.

  2. Forschungsmanager: Der Forschungsmanager fungiert als Qualitätskontrollhüter. Er überprüft die von den Forschern gelieferten Forschungsergebnisse, gibt Feedback und stellt sicher, dass die gesammelten Informationen umfassend und mit den Forschungszielen abgestimmt sind.

  3. Forscher: Die Forscher sind die Arbeitstiere des Systems. Sie sind für die eigentliche Forschung verantwortlich, führen Google-Suchen durch, scrapen relevante Websites und fassen die Ergebnisse zusammen.

Die Koordination zwischen diesen Agenten wird durch das Autogon-Framework erleichtert, das die Verwendung der OpenAI-Assistenten-API vereinfacht. Jeder Agent wird als GPT-Assistent-Agent definiert, mit spezifischen Systemaufforderungen und registrierten Funktionen. Die Agenten kommunizieren über einen Gruppenchat, in dem der Direktor Aufgaben delegiert, die Forscher Updates liefern und der Manager Feedback gibt und Korrekturen vornimmt.

Indem der Forschungsprozess in diese spezialisierten Rollen unterteilt wird, kann das System konsistentere und hochwertigere Forschungsergebnisse liefern. Der Direktor stellt sicher, dass die Forschung mit den übergeordneten Zielen übereinstimmt, der Manager übernimmt die Qualitätskontrolle und die Forscher konzentrieren sich auf die Ausführung der Aufgaben.

Dieser Multi-Agenten-Ansatz stellt einen Paradigmenwechsel dar, wie wir über AGI (Künstliche Allgemeine Intelligenz) denken. Anstelle einer einzelnen, allmächtigen KI besteht das System aus mehreren spezialisierten Agenten, die an einem gemeinsamen Ziel zusammenarbeiten. Dieses modulare und skalierbare Design ermöglicht die Einführung zusätzlicher Agenten wie eines "Forschungsdirektors" oder "Datenanalysten", um die Fähigkeiten des Systems weiter zu verbessern.

Schlussfolgerung

Die Entwicklung des KI-Forschersystems zeigt den rasanten Fortschritt in den KI-Fähigkeiten, insbesondere in den Bereichen der Multi-Agenten-Zusammenarbeit und der aufgabenorientierten Logik. Die Schlüsselhighlights dieses Systems umfassen:

  1. Modulare Agentenarchitektur: Das System wird mit einem Multi-Agenten-Ansatz aufgebaut, wobei spezialisierte Agenten (Direktor, Forschungsmanager und

FAQ