Откройте для себя следующее поколение программного обеспечения, управляемого искусственным интеллектом: передовые обновления от OpenDevin

Откройте для себя передовые инструменты разработки программного обеспечения с искусственным интеллектом от OpenDevin, включая нового агента CodeAct 1.0 с показателем решения 21% на эталонном тесте Sway. Узнайте о упрощенном испытательном стенде для тестирования агентов кодирования. Оптимизируйте свою разработку программного обеспечения с помощью этих передовых достижений.

14 февраля 2025 г.

party-gif

Раскройте силу разработки программного обеспечения с открытым исходным кодом с помощью последних достижений OpenDevin. Узнайте, как его передовой кодовый агент CodeAct 1.0 и упрощенный испытательный стенд могут оптимизировать ваш процесс разработки программного обеспечения и помочь вам более эффективно создавать и развертывать приложения.

Основные обновления для OpenDevin: Представляем CodeAct 1.0 и новый упрощенный оценочный стенд

OpenDevin, открытая альтернатива DeepMind's DeepCode, недавно объявила о двух основных обновлениях своей платформы. Первое - это введение CodeAct 1.0, нового передового агента кодирования, который достигает впечатляющего показателя в 21% по решению задач в легкой версии SowaiBench без помощи, что на 177% лучше, чем его предыдущие результаты. Этот агент построен на основе фреймворка CodeAct, объединяя действия агентов больших языковых моделей в единый интерфейс кода.

Второе объявление - это введение новой упрощенной системы оценки для тестирования агентов кодирования. Эта система направлена на облегчение всестороннего и улучшенного оценивания агентов, что позволит лучше сравнивать их и способствовать непрерывному совершенствованию этих инструментов ИИ со временем.

Агент CodeAct 1.0 вводит ряд ключевых возможностей, включая способность общаться с людьми, классифицировать код, подтверждать и выполнять код (как команды Linux bash, так и Python), а также выполнять различные действия, связанные с файлами, такие как открытие, навигация, поиск и редактирование. Эти возможности построены на основе уроков, извлеченных из предыдущей системы агентов SowaiBench, дальнейшего расширения инструментария и улучшения общей производительности.

Кроме того, новая система оценки включает механизм обратного отсчета, вдохновленный проектом Mint, который побуждает модель выполнять задачи в пределах фиксированного числа взаимодействий. Это, наряду с процессом написания и разбора упрощенных команд bash, повышает удобство использования и доступность платформы.

Эти обновления OpenDevin демонстрируют непрерывные усилия по расширению возможностей разработки программного обеспечения с помощью передовых агентов ИИ. Используя предварительную подготовку больших языковых моделей на данных кода и сосредоточившись на использовании обширных программных пакетов, агент CodeAct 1.0 стремится более эффективно решать сложные задачи кодирования и реальные проблемы разработки программного обеспечения. Новая упрощенная система оценки будет способствовать дальнейшему совершенствованию этих агентов, в конечном итоге принося пользу разработчикам и инженерам-программистам в их повседневной работе.

Часто задаваемые вопросы