Nắm bắt Nhiệm vụ Phức tạp với AutoGen: Khung Hợp tác Trí tuệ Nhân tạo của Microsoft

Khám phá khung công tác hợp tác trí tuệ nhân tạo mạnh mẽ của Microsoft, AutoGen, khi nó giải quyết các nhiệm vụ phức tạp. Tìm hiểu cách các luồng công việc đa tác nhân vượt trội hơn các giải pháp đơn tác nhân, mở khóa các khả năng mới trong tự động hóa, phát triển phần mềm và nhiều hơn nữa.

14 tháng 2, 2025

party-gif

Mở khóa sức mạnh của việc giải quyết các nhiệm vụ phức tạp với AutoGen của Microsoft, một khung công tác đa tác nhân tiên tiến vượt trội so với các giải pháp đơn tác nhân trước đây. Khám phá cách bản cập nhật sáng tạo này cho phép các ứng dụng mô hình ngôn ngữ lớn tinh vi với khả năng hợp tác, cá nhân hóa và phân rã nhiệm vụ được tăng cường. Khám phá tiềm năng để tự động hóa các quy trình khác nhau và tạo ra các giải pháp phần mềm sáng tạo, tất cả từ sự thoải mái của máy tính cá nhân của bạn.

Cập nhật mạnh mẽ: Các khả năng nâng cao của Autogen trong việc giải quyết các nhiệm vụ phức tạp

Bộ khung đa tác nhân Autogen của Microsoft, một công cụ mạnh mẽ để xây dựng các cuộc hội thoại, đã nhận được một bản cập nhật đáng kể tập trung vào việc nâng cao khả năng xử lý các nhiệm vụ phức tạp và cải thiện hiệu suất của các tác nhân. Bản cập nhật này, được thảo luận bởi Adam Forna, một nhà nghiên cứu chính tại Microsoft Research AI, thể hiện sự hiệu quả của việc sử dụng nhiều tác nhân làm việc hợp tác để hoàn thành các nhiệm vụ phức tạp nhiều bước.

Điểm nổi bật chính của bản cập nhật này bao gồm:

  1. Hoàn thành nhiệm vụ tốt hơn: Khung Autogen mới có thể vượt qua các giải pháp đơn tác nhân trước đây trên các tiêu chuẩn như GAIA, chứng minh khả năng xử lý các nhiệm vụ phức tạp một cách hiệu quả hơn.

  2. Sắp xếp tác nhân tùy chỉnh: Người dùng bây giờ có thể tạo các sắp xếp tác nhân tùy chỉnh có thể hợp tác, suy luận và sử dụng các công cụ khác nhau để đạt được các kết quả phức tạp.

  3. Suy luận và sử dụng công cụ nâng cao: Các tác nhân trong khung Autogen có khả năng suy luận, lập kế hoạch và sử dụng các công cụ để hoàn thành các nhiệm vụ, vượt xa việc chỉ tạo ra văn bản.

  4. Giải quyết nhiệm vụ lặp đi lặp lại: Các tác nhân tuân theo một vòng lặp giao nhiệm vụ, theo dõi tiến độ và cập nhật phương pháp tiếp cận của họ nếu gặp tình trạng trì trệ, cho phép khám phá các giải pháp một cách có hệ thống hơn.

  5. Các cải tiến trong tương lai: Nhóm Autogen đang khám phá các cơ hội để giới thiệu các tác nhân mới có thể học hỏi và tự cải thiện với kinh nghiệm, hiểu thông tin trực quan tốt hơn và sử dụng các chiến lược thực dụng hơn để khám phá không gian giải pháp.

Sức mạnh của sự hợp tác đa tác nhân

Bản cập nhật mới của khung Autogen của Microsoft thể hiện sự hiệu quả của việc sử dụng nhiều tác nhân làm việc cùng nhau để hoàn thành các nhiệm vụ phức tạp, nhiều bước. Theo Adam Forna, một nhà nghiên cứu chính tại Microsoft Research AI, cách tiếp cận này cho phép các tác nhân vượt qua các giải pháp đơn tác nhân trước đây trên các tiêu chuẩn như GAIA.

Chìa khóa để thành công này nằm ở khả năng tạo ra các sắp xếp tác nhân tùy chỉnh có thể hợp tác, suy luận và sử dụng các công cụ khác nhau để đạt được các kết quả phức tạp. Forna mô tả các tác nhân là "các trừu tượng rất mạnh mẽ" có thể xử lý phân chia nhiệm vụ, chuyên môn hóa và sử dụng công cụ. Bằng cách lắp ráp đội ngũ tác nhân phù hợp, người dùng có thể giải quyết các vấn đề phức tạp một cách hiệu quả hơn.

Khung Autogen, là mã nguồn mở và có sẵn trên GitHub, cho phép tạo ra các quy trình làm việc đa tác nhân này. Bài trình diễn do Forna thể hiện một nhóm gồm bốn tác nhân: một trợ lý tổng quát, một máy tính đầu cuối, một máy chủ web và một người điều phối. Nhóm này đã đạt được kết quả hàng đầu trên tiêu chuẩn GAIA, tăng gấp đôi hiệu suất trên các câu hỏi khó nhất.

Các tác nhân tuân theo một kế hoạch có cấu trúc, bắt đầu với lời nhắc nhiệm vụ và xây dựng một "sổ cái" các sự kiện đã được xác minh, đoán và thông tin cần tra cứu. Sau đó, họ phân công nhiệm vụ cho các tác nhân riêng lẻ, theo dõi tiến độ và lặp lại nếu cần thiết. Cách tiếp cận này cho phép các tác nhân suy luận, hành động và quan sát, khai thác các khả năng chuyên môn của họ để giải quyết các vấn đề phức tạp.

Trình diễn hiệu suất của Autogen trên Bộ Tiêu chuẩn GIAI

Adam Forna, một nhà nghiên cứu chính tại Microsoft Research AI, đã trình bày công việc của nhóm về việc hoàn thành các nhiệm vụ phức tạp bằng cách sử dụng các quy trình làm việc đa tác nhân trong khung Autogen. Mục tiêu là hoàn thành một cách đáng tin cậy các nhiệm vụ phức tạp và kéo dài bằng cách sử dụng các mô hình nền tảng lớn.

Nhóm đã áp dụng cách tiếp cận sử dụng các quy trình làm việc đa tác nhân làm nền tảng để đạt được điều này. Các tác nhân là các trừu tượng mạnh mẽ có thể xử lý phân chia nhiệm vụ, chuyên môn hóa và sử dụng công cụ. Bằng cách lắp ráp một nhóm các tác nhân, chẳng hạn như một trợ lý tổng quát, một máy tính đầu cuối, một máy chủ web và một người điều phối, nhóm đã có thể đạt được hiệu suất hàng đầu trên bảng xếp hạng GIAI (Trợ giúp AI Tổng quát).

Cụ thể, quy trình làm việc bốn tác nhân của nhóm đã có thể:

  1. Dẫn đầu bảng xếp hạng GIAI: Vào tháng 3, giải pháp của nhóm đã đạt được kết quả hàng đầu trên bảng xếp hạng GIAI, vượt qua các giải pháp đơn tác nhân trước đây khoảng 8 điểm.

  2. Cải thiện đáng kể trên các câu hỏi khó nhất: Giải pháp của nhóm đã có thể tăng gấp đôi hiệu suất trên tập hợp câu hỏi khó nhất (Cấp độ 3) trong tiêu chuẩn GIAI, mà các tác giả mô tả là yêu cầu "các chuỗi hành động có thể kéo dài tùy ý, sử dụng bất kỳ số lượng công cụ nào và truy cập vào thế giới nói chung".

Chìa khóa để thành công của nhóm là quá trình lặp đi lặp lại mà các tác nhân của họ tuân theo:

  1. Tạo ra một sổ cái: Các tác nhân bắt đầu bằng cách tạo ra một bộ nhớ làm việc bao gồm các sự kiện đã cho hoặc đã được xác minh, các sự kiện cần tra cứu và các đoán định có căn cứ.
  2. Phân công nhiệm vụ: Sau đó, các nhiệm vụ được phân công cho các tác nhân độc lập.
  3. Lặp lại và phân công: Các tác nhân bước vào một vòng lặp bên trong, kiểm tra xem họ đã hoàn thành hay vẫn đang tiến bộ. Miễn là họ đang tiến bộ, họ sẽ phân công bước tiếp theo cho tác nhân tiếp theo.
  4. Xử lý tình trạng trì trệ: Nếu các tác nhân không tiến bộ trong ba vòng, họ sẽ quay lại, cập nhật Sổ cái, đưa ra một tập hợp nhiệm vụ mới và bắt đầu lại.

Cấu hình này đã hoạt động tốt cho nhóm, và họ rất phấn khích về các cơ hội để giới thiệu các tác nhân mới có thể học hỏi, tự cải thiện, hiểu hình ảnh và ảnh chụp màn hình tốt hơn, và khám phá không gian giải pháp một cách có hệ thống hơn.

Khung Autogen là mã nguồn mở và có sẵn trên GitHub, và nhóm khuyến khích mọi người kiểm tra và bắt đầu sử dụng bản cập nhật mạnh mẽ này.

Vòng lặp giải quyết vấn đề của các tác nhân

Các tác nhân tuân theo một vòng lặp có cấu trúc để giải quyết các nhiệm vụ phức tạp. Quá trình bắt đầu với câu hỏi hoặc lời nhắc ban đầu, mà các tác nhân sử dụng để tạo ra một "sổ cái" - một bộ nhớ làm việc chứa các sự kiện đã cho hoặc đã được xác minh, các sự kiện cần tra cứu và các đoán định có căn cứ.

Với sổ cái đã sẵn sàng, các tác nhân phân công nhiệm vụ cho các tác nhân độc lập trong nhóm. Sau đó, các tác nhân bước vào một vòng lặp bên trong, nơi họ đầu tiên kiểm tra xem nhiệm vụ đã hoàn thành chưa. Nếu chưa, họ đánh giá xem họ vẫn đang tiến bộ hay không. Miễn là vẫn đang tiến bộ, các tác nhân sẽ phân công bước tiếp theo cho tác nhân phù hợp.

Tuy nhiên, nếu các tác nhân phát hiện ra rằng họ không còn tiến bộ nữa, họ sẽ ghi lại điều đó. Họ vẫn có thể phân công một bước nữa, nhưng nếu tình trạng trì trệ vẫn tiếp tục trong ba vòng, họ sẽ quay lại, cập nhật sổ cái và đưa ra một tập hợp nhiệm vụ mới cho các tác nhân, bắt đầu lại quá trình.

Phương pháp tiếp cận có cấu trúc này, với các tác nhân hợp tác và theo dõi tiến độ của họ, cho phép nhóm giải quyết hiệu quả các nhiệm vụ phức tạp, nhiều bước, vượt qua các giải pháp đơn tác nhân trước đây trên các tiêu chuẩn như thách thức GAIA.

Kế hoạch tương lai: Nâng cao khả năng của Autogen

Nhóm nghiên cứu đằng sau Autogen rất phấn khích về các cơ hội để tiếp tục nâng cao khả năng của khung này. Một số kế hoạch chính cho tương lai của họ bao gồm:

  1. Giới thiệu các tác nhân mới: Nhóm đang tìm cách thêm các tác nhân mới có thể học hỏi và tự cải thiện với kinh nghiệm. Những tác nhân này có thể hiểu hình ảnh, ảnh chụp màn hình và giao diện tốt hơn, cho phép sử dụng web và công cụ hiệu quả hơn.

  2. Cải thiện khám phá có hệ thống: Các nhà nghiên cứu muốn làm cho các tác nhân trở nên thực dụng hơn trong các chiến lược giải quyết vấn đề của họ. Thay vì chỉ cập nhật sổ cái và bắt đầu lại khi bị mắc kẹt, các tác nhân sẽ có thể khám phá không gian giải pháp một cách có hệ thống hơn, sử dụng các chiến lược tốt hơn để tiến bộ.

  3. Giải quyết các tiêu chuẩn và tình huống thực tế ngày càng phức tạp: Nhóm đã bắt đầu áp dụng cấu hình Autogen hiện tại để giải quyết các tiêu chuẩn và trường hợp sử dụng thực tế phức tạp hơn. Họ rất mong muốn xem cách tiếp cận đa tác nhân có thể xử lý các nhiệm vụ ngày càng thách thức.

  4. Tăng cường hợp tác và phối hợp giữa các tác nhân: Các nhà nghiên cứu có kế hoạch khám phá các cách để cải thiện sự

Câu hỏi thường gặp