解鎖下一代 AI 驅動的軟體開發:OpenDevin 的尖端升級

探索 OpenDevin 的尖端 AI 驅動軟體開發工具,包括新的 CodeAct 1.0 代理,在 Sway 基準測試中的解決率為 21%。了解用於測試編碼代理的簡化評估框架。利用這些下一代進步優化您的軟體開發。

2025年2月24日

party-gif

利用 OpenDevin 最新的進步,解鎖開源 AI 軟體工程的力量。探索其最先進的編碼代理 CodeAct 1.0 和簡化的評估框架如何能夠簡化您的軟體開發過程,並幫助您更有效地構建和部署應用程式。

OpenDevin 的重大升級:引入 CodeAct 1.0 和新的簡化評估框架

開放式 DeVin (OpenDevin),這個 DeepMind 的 DeepCode 的開源替代品,最近宣布了其框架的兩大重大升級。第一個是推出了 CodeAct 1.0,這是一個全新的最先進的編碼代理,在 SowaiBench 輕量級無輔助版本上實現了 21% 的驚人解決率,較之前的表現提高了 177%。這個代理建立在 CodeAct 框架之上,將大型語言模型代理的行為整合到一個統一的代碼接口中。

第二個公告是推出了一個新的簡化評估工具,用於測試編碼代理。這個工具旨在促進對代理的全面和改進的評估,從而實現更好的比較,並推動這些 AI 工具的持續改進。

CodeAct 1.0 代理引入了幾個關鍵功能,包括與人類對話、分類代碼、確認和執行代碼(包括 Linux bash 命令和 Python)以及執行各種文件相關操作,如打開、瀏覽、搜索和編輯。這些功能建立在之前 SowaiBench 代理框架的經驗基礎之上,進一步擴展了工具集,提高了整體性能。

此外,新的評估工具還引入了倒計時機制,靈感來自 Mint 項目,鼓勵模型在固定的交互次數內完成任務。這與編寫和解析簡化的 bash 命令的過程相結合,提高了框架的用戶友好性和可訪問性。

這些 OpenDevin 的升級展示了利用先進 AI 代理賦能軟件開發的持續努力。通過利用大型語言模型在代碼數據上的預訓練,並專注於利用廣泛的軟件包,CodeAct 1.0 代理旨在更有效地解決複雜的編碼任務和現實世界的軟件開發挑戰。新的簡化評估工具將進一步推動這些代理的持續改進,最終使開發人員和軟件工程師受益。

常問問題