如何构建强大的多智能体 AI 研究系统

学习如何构建一个强大的多智能体 AI 研究系统,该系统可以自主对任何主题进行详细研究,优化质量,并在 Airtable 中更新研究结果 - 一步一步的教程。

2025年2月18日

party-gif

利用这个创新的多智能体系统释放 AI 驱动研究的力量。探索如何建立一支专业化的 AI 助手团队,他们能够无缝协作,提供任何主题的高质量、基于事实的研究。简化您的研究流程,为您的商业或个人项目开启新的可能性。

构建 AI 研究团队: 强大的多智能体方法

构建这个多智能体研究系统的关键步骤如下:

  1. 创建三个不同的GPT助手:

    • 主管: 读取和更新Airtable数据库,分解研究任务,并委派给研究经理和研究人员。
    • 研究经理: 生成研究计划,审查并确保研究人员提供的研究结果的质量保证。
    • 研究人员: 实际浏览互联网,收集信息,并产生研究结果的代理。
  2. 使用Anthropic的Autogon框架:

    • Autogon通过提供一种简单的方式来协调不同代理之间的合作,简化了使用OpenAI助手API。
  3. 实现必要的功能:

    • Google搜索
    • 网站抓取和总结
    • Airtable记录检索和更新
  4. 将代理连接在一起:

    • 创建一个包含用户代理、研究人员、研究经理和主管的群聊。
    • 触发群聊消息以启动研究过程。

研究智能体的演化: 从线性到目标导向

过去,我的研究代理是一个简单的线性语言模型链,遵循一个非常直接的过程。它可以接受一个研究主题,触发Google搜索,并让一个大型语言模型选择最相关的链接和编写网站脚本。代理然后根据收集的信息生成一份报告。虽然这种方法可以工作,但它仅限于非常基本和明显的研究任务。

两个月后,研究代理进化成为一个AI代理 - 一个大型语言模型、记忆和工具的组合。这个代理可以进行推理,将一个大目标分解成子任务,并可以访问各种工具,如Google搜索API,来完成这些任务。它还有长期记忆,可以记住之前的行动。根本区别在于,AI代理更注重目标,允许它采取多个行动来完成一项研究任务,即使目标相当模糊。

这个研究代理的第二个版本是一个重大改进,提供了更高质量的研究结果,并提供了参考链接列表。然而,它仍然存在一些问题。结果的质量并不总是一致的,而且代理在处理OpenAI模型无法处理的复杂或受限操作(如找到特定的联系信息)时也会遇到困难。

下一个突破来自于像M-GPT和ChatDef这样的多智能体系统。这些系统旨在通过引入不止一个,而是多个协作的代理来提高任务性能。最近的框架,如Autogon,使得创建这些协作系统变得更加容易,允许灵活地创建各种层次结构和结构来协调不同代理之间的合作。

随着OpenAI助手API和GPT-3的发布,构建有用代理的成本大幅下降。这促使我创建了AI研究员3.0,其中原始的研究员代理仍然执行研究,但引入了研究经理代理来评估结果并确保质量控制。此外,还可以添加一个研究主管代理,将大型研究目标分解成子任务,并将其委派给研究经理和研究人员,同时还处理从Airtable数据库读取和写入的任务。

这个多智能体系统代表了我们思考AGI的一种范式转变。与其说是一个可以做所有事情的单一AI,不如说是创建能够协作实现共同目标的专门代理。这种方法解决了训练单一、全能AGI系统的技术挑战。

训练这些高度专门化代理的关键在于两种常见的方法:微调和知识库检索增强生成(RAG)。微调在您想要提高模型在特定任务上的技能时很有用,而RAG更适合为大型语言模型提供准确和最新的数据。

为了使微调过程更加可访问,像Gradio这样的平台出现了,简化了对像LLaMA和Hermit这样的高性能开源模型的微调。Gradio消除了对专用基础设施和计算单元的需求,允许开发人员和企业只需几行代码和按需付费的定价模式就可以微调模型。

通过利用这些进步,AI研究员3.0系统现在可以提供更一致和自主的研究结果,各个代理协作以确保质量和效率。

克服局限性: 引入专门的智能体和协作

AI研究员的初始版本存在局限性,如线性流程和质量不一致。为了解决这些问题,作者探索了使用AI代理 - 大型语言模型、记忆和工具的组合。这允许更面向目标的研究,代理可以将任务分解成子任务,并利用各种工具来完成研究。

引入像M8GT和ChatDef这样的多智能体系统,进一步提高了任务性能,因为多个代理进行了协作。最近的框架,如Anthropic的Autogen,使创建这些协作系统变得更加容易,允许开发灵活的层次结构和结构来协调不同代理之间的合作。

作者然后决定创建一个AI研究员3.0,其中原始的研究员代理将专注于实际的研究,而引入了一个研究经理代理来评估结果并确保质量控制。此外,还添加了一个研究主管代理,将研究目标分解成子任务,并将其委派给研究经理和研究人员代理。这种多智能体方法导致了更一致的研究质量和更自主的系统。

作者还讨论了训练专门代理的两种常见方法:微调和知识库检索增强生成(RAG)。虽然微调可以提高模型在特定任务上的技能,但它可能很有挑战性,需要专门的硬件。作者强调Anthropic的Gradio平台是一个简化微调过程并使其对开发人员和企业可访问的工具。

最后,作者提供了一个分步指南,说明如何使用Autogen构建这个多智能体研究系统,展示了这种方法在创建自主和协作AI系统方面的灵活性和力量。

微调变得更加简单: 利用梯度进行模型定制

微调高性能开源模型可能是一项具有挑战性的任务,通常需要具有大内存容量的专用硬件。然而,Anthropic开发的Gradient平台大大降低了微调的障碍,使整个过程对所有开发人员和企业来说都极其简单和可访问。

只需几行代码,您就可以使用Gradient微调LLaMA、Noris和Hermès等模型。该平台支持多种编程语言,包括Node.js、Python和命令行界面,并提供所有必要的工具和教程,让您快速入门。

Gradient的一个关键优势是其定价模型。传统上,微调需要预先投资专用基础设施和计算单元。相反,Gradient消除了对基础设施的需求,并允许您仅根据令牌系统支付您使用的费用。

如果您点击下面描述中的链接,您将获得$5的免费积分,开始使用Gradient。如果您需要微调模型但不知道从何开始,这可能特别有帮助。Gradient的用户友好平台和全面的资源使整个过程变得无缝,让您可以专注于自己的用例和需求。

协调研究团队: 角色、职责和协调

构建有效的多智能体研究系统的关键在于明确定义每个代理的角色和职责,并建立一个健壮的协调框架。在这个系统中,我们有三个不同的代理:

  1. 研究主管: 主管负责管理整个研究过程。他们从Airtable数据库中提取要研究的公司列表,将研究任务分解,并委派给研究经理和研究人员。主管还将完成的研究结果更新到Airtable记录中。

  2. 研究经理: 研究经理充当质量控制的把关人。他们审查研究人员提供的研究结果,提供反馈,并确保收集的信息全面且与研究目标一致。

  3. 研究人员: 研究人员是系统的工作马。他们负责实际进行研究,执行Google搜索,抓取相关网站,并总结研究结果。

Autogon框架促进了这些代理之间的协调,简化了使用OpenAI助手API。每个代理都被定义为一个GPT助手代理,具有特定的系统提示和注册功能。代理通过群聊进行交流,主管委派任务,研究人员提供更新,经理审查并提供反馈。

通过将研究过程分解为这些专门的角色,该系统能够提供更一致和高质量的研究结果。主管确保研究符合整体目标,经理提供质量控制,研究人员专注于执行任务。

这种多智能体方法代表了我们思考AGI(人工通用智能)的一种范式转变。与其说是一个单一的、全能的AI,不如说是由多个专门的代理组成的系统,他们协作实现共同目标。这种模块化和可扩展的设计允许引入额外的代理,如"研究主管"或"数据分析师

结论

进一步增强系统的功能。

AI研究员系统的发展展示了AI能力的快速进步,特别是在多智能体协作和面向任务的推理方面。这个系统的关键亮点包括:

  1. 模块化代理架构: 该系统采用多智能体方法构建,具有专门的代理(主管、研究经理和研究人员)协作完成研究任务。这种模块化设计提供了灵活性和可扩展性。

  2. 自动化研究工作流: 该系统自动化了研究过程,从分解研究目标、委派任务、进行网络搜索和总结结果,到在Airtable数据库中更新最终结果。

  3. 质量保证: 研究经理代理充当质量控制机制,提供反馈并推动研究人员代理找到更全面的信息,以确保高质量的研究输出。

  4. 利用外部工具: 该系统集成了各种外部服务,如Google搜索、网页抓取和Airtable,以收集和组织研究数据,展示了利用多样化工具的能力。

  5. 持续改进: 作者强调了迭代开发过程,每个版本的AI研究员系统都引入了新的功能,并解决了之前的局限性,如质量不一致和内存管理。

  6. 可访问性和可扩展性: 使用Gradio进行模型微调和Autogen进行多智能体协调的平台,有助于降低开发人员构建和部署此类系统的技术障碍。

总的来说,这个AI研究员系统代表了自主、面向任务的AI代理发展的重大进步,这些代理可以协作解决复杂的研究任务。模块化和可扩展的设计,结合外部工具和服务的集成,展示了这种系统在各种领域(从销售和风险投资到任何需要全面可靠研究的领域)的广泛应用潜力。

FAQ