掌握複雜任務的自動生成:微軟的 AI 協作框架
探索微軟強大的 AI 協作框架 AutoGen,它能處理複雜的任務。了解多智能體工作流程如何超越單一智能體解決方案,開啟自動化、軟體開發等領域的新可能性。
2025年2月21日

解鎖使用 Microsoft 的 AutoGen 解決複雜任務的力量,這是一個尖端的多智能體框架,其性能優於以前的單智能體解決方案。探索這個創新更新如何實現複雜的大型語言模型應用程式,增強協作、個性化和任務分解功能。探索自動化各種流程和創造創新軟體解決方案的潛力,全都在您本地電腦的舒適環境中。
強大的更新:Autogen 增強的複雜任務解決能力
強大的更新:Autogen 增強的複雜任務解決能力
微軟的Autogen是一個強大的多智能體對話框架,最近進行了重大更新,重點是提升其處理複雜任務和改善智能體性能的能力。這次更新由微軟研究院AI首席研究員Adam Forna介紹,展示了多個智能體協作完成複雜多步驟任務的有效性。
這次更新的主要亮點包括:
-
任務完成度提升: 新的Autogen框架在GAIA等基準測試中的表現優於之前的單一智能體解決方案,展現了其更有效處理複雜任務的能力。
-
可自訂的智能體編排: 用戶現在可以創建可自訂的智能體編排,讓它們能夠協作、推理並利用各種工具來實現複雜的結果。
-
增強的推理和工具使用能力: Autogen框架內的智能體具有推理、規劃和利用工具完成任務的能力,不僅限於生成文本。
-
迭代式任務解決: 智能體遵循分配任務、監控進度、並在遇到停滯時更新方法的循環,允許更系統地探索解決方案。
-
未來的增強功能: Autogen團隊正在探索引入新的智能體,使其能夠通過經驗學習和自我提升、更好地理解視覺信息,以及採用更務實的策略探索解決空間。
對Autogen的這次更新展示了多智能體協作在處理複雜現實任務中的力量,使其成為開發人員、研究人員和企業自動化及簡化各種流程的有價值工具。
多智能體協作的力量
多智能體協作的力量
微軟Autogen框架的新更新展示了使用多個協作智能體完成複雜多步驟任務的有效性。根據微軟研究院AI首席研究員Adam Forna的介紹,這種方法使智能體在GAIA等基準測試中的表現優於之前的單一智能體解決方案。
成功的關鍵在於能夠創建可自訂的智能體編排,讓它們能夠協作、推理並利用各種工具來實現複雜的結果。Forna將智能體描述為"非常強大的抽象"概念,能夠處理任務分解、專業化和工具使用。通過組建合適的智能體團隊,用戶可以更有效地解決複雜的問題。
Autogen框架是開源的,可在GitHub上獲得。Forna展示的演示中,團隊使用了四個智能體:一個通用助手、一個電腦終端、一個Web服務器和一個協調器。這個團隊在GAIA基準測試中取得了最佳成績,在最具挑戰性的問題上的表現超過了之前的一倍。
智能體遵循一個結構化的計劃,從任務提示開始,建立一個包含已驗證事實、猜測和需要查找的信息的"帳本"。然後他們將任務分配給個別智能體,監控進度並在必要時進行迭代。這種方法使智能體能夠推理、行動和觀察,利用其專門的能力來解決複雜的問題。
展望未來,Autogen團隊很興奮能夠探索進一步的增強功能,如引入能夠學習和自我提升、更好理解視覺信息,以及更系統地探索解決空間的智能體。通過不斷推進多智能體協作的界限,Autogen旨在使用大型基礎模型可靠地完成長期複雜任務。
展示 Autogen 在 GIAI 基準測試上的表現
展示 Autogen 在 GIAI 基準測試上的表現
微軟研究院AI首席研究員Adam Forna介紹了團隊使用Autogen框架中的多智能體工作流程完成複雜任務的工作。目標是使用大型基礎模型可靠地完成長期複雜任務。
團隊採用了使用多智能體工作流程作為實現這一目標的平台。智能體是強大的抽象概念,可以處理任務分解、專業化和工具使用。通過組建包括通用助手、電腦終端、Web服務器和協調器在內的智能體團隊,團隊能夠在GIAI(通用AI協助)基準測試中取得最先進的成績。
具體來說,該團隊的四個智能體工作流程能夠:
-
登頂GIAI排行榜: 3月,該團隊的解決方案在GIAI排行榜上取得了最佳成績,超過之前的單一智能體解決方案約8分。
-
在最困難的問題上大幅提升: 該團隊的解決方案在GIAI基準測試中最困難的一組問題(3級)上的表現超過了之前的一倍,作者描述這些問題"需要任意長的行動序列、使用任意數量的工具,以及對整個世界的訪問"。
團隊成功的關鍵在於智能體遵循的迭代過程:
- 生成帳本: 智能體首先生成一個工作記憶,包含給定或已驗證的事實、需要查找的事實和有根據的猜測。
- 分配任務: 然後將任務分配給獨立的智能體。
- 迭代和委派: 智能體進入內部循環,檢查是否完成或仍在取得進展。只要仍在取得進展,他們就會將下一步委派給下一個智能體。
- 處理停滯: 如果智能體在三輪內沒有取得進展,他們會回去更新帳本,提出新的任務分配,然後重新開始。
這種配置對團隊來說效果很好,他們對引入能夠學習、自我提升、更好理解圖像和截圖,以及更系統地探索解決空間的新智能體感到興奮。
Autogen框架是開源的,可在GitHub上獲得,團隊鼓勵大家查看並開始使用這個強大的新更新。
智能體的問題解決循環
智能體的問題解決循環
智能體遵循一個結構化的循環來處理複雜任務。這個過程始於初始問題或提示,智能體使用它來生成一個"帳本" - 一個包含給定或已驗證事實、需要查找的事實和有根據猜測的工作記憶。
有了帳本後,智能體將任務分配給團隊中的獨立智能體。智能體然後進入內部循環,首先檢查任務是否完成。如果沒有,他們會評估是否仍在取得進展。只要仍在取得進展,智能體就會將下一步委派給適當的智能體。
但是,如果智能體發現已經不再取得進展,他們會記下這一點。他們可能仍會委派一個步驟,但如果停滯持續三輪,他們將返回,更新帳本,並為智能體提出新的任務分配,重新啟動這個過程。
這種結構化的方法,智能體協作並監控他們的進度,使團隊能夠有效地處理複雜的多步驟任務,在GAIA等基準測試中超越之前的單一智能體解決方案。
未來計劃:提升 Autogen 的能力
未來計劃:提升 Autogen 的能力
Autogen背後的研究團隊對進一步增強該框架的功能感到興奮。他們的一些主要未來計劃包括:
-
引入新的智能體: 團隊正在尋求添加新的智能體,使其能夠通過經驗學習和自我提升。這些智能體可以更好地理解圖像、截圖和界面,從而能夠更有效地上網和使用工具。
-
提高系統性探索: 研究人員希望使智能體在解決問題的策略上更加務實。而不是僅僅更新帳本並重新啟動,智能體將能夠更系統地探索解決空間,採用更好的策略取得進展。
-
應對越來越複雜的基準測試和現實世界場景: 該團隊已經開始將當前的Autogen配置應用於更複雜的基準測試和現實世界用例。他們迫不及待地想看看多智能體方法如何應對日益複雜的任務。
-
增強智能體協作和協調: 研究人員計劃探索提高智能體之間協作和協調的方法,使他們能夠更有效地共同完成複雜的多步驟任務。
-
改善帳本管理和決策: 該團隊將專注於完善帳本管理系統和智能體使用的決策過程,確保他們在任務完成期間能做出更明智和高效的選擇。
通過追求這些未來計劃,Autogen研究團隊旨在進一步提升該框架的功能,使其成為一個更強大的工具,通過使用協作的多智能體系統來解決複雜的現實世界問題。
常問問題
常問問題