ИИ ближе, чем мы думаем: смелое 3-5-летнее прогнозирование исследователя OpenAI

Исследуйте смелое 3-5-летнее прогнозирование исследователя OpenAI для временной шкалы Искусственного Общего Интеллекта (AGI). Погрузитесь в ключевые компоненты общего интеллекта и инсайты о прогрессе в мировых моделях, мышлении системы 2 и воплощении. Откройте для себя потенциальную конвергенцию робототехники и крупных языковых моделей, намекающую на захватывающее будущее AGI.

24 февраля 2025 г.

party-gif

Откройте для себя замечательные идеи от исследователя OpenAI о быстром прогрессе в области искусственного общего интеллекта (AGI) и о том, насколько мы можем быть ближе к этому рубежу, чем вы думаете. Изучите ключевые компоненты, необходимые для создания общего интеллектуального агента, и узнайте о возможном графике достижения AGI в ближайшие годы.

Ключевые компоненты общего интеллектуального агента

Для создания в целом интеллектуальной сущности требуется синтез трех ключевых компонентов:

  1. Способ взаимодействия и наблюдения за сложной средой: Это, как правило, означает воплощение - способность воспринимать и взаимодействовать с окружающим миром с помощью различных сенсорных входов, таких как осязание, обоняние, зрение и т.д. Это позволяет сущности построить надежную модель мира, охватывающую окружающую среду.

  2. Механизм для проведения глубокой интроспекции на произвольные темы: Это способность к рассуждению или "медленному мышлению" (мышление системы 2), когда сущность может глубоко размышлять над проблемами и разрабатывать планы для их решения.

  3. Модель мира, охватывающая окружающую среду: Это механизм, который позволяет сущности быстро делать выводы с разумной точностью, подобно человеческой "интуиции" или "быстрому мышлению" (мышление системы 1).

С этими тремя компонентами сущность может быть "посеяна" с целями, и использовать свое мышление системы 2 в сочетании со своей моделью мира, чтобы придумывать способы оптимизации для этих целей. Затем она может предпринимать действия, наблюдать результаты и соответствующим образом обновлять свою модель мира. Этот цикл можно повторять в течение длительных периодов, позволяя сущности последовательно выполнять и оптимизировать любую заданную цель.

Ключевое отличие в том, что сущности не обязательно нужна способность достигать произвольных целей, а скорее адаптивность и согласованность для непрерывных действий в направлении единой цели во времени. Это и определяет по-настоящему способную, в целом интеллектуальную систему.

Построение моделей мира и повышение устойчивости

Мы уже строим модели мира с помощью авторегрессивных трансформеров, той же архитектуры, которую мы недавно использовали, особенно модели Omni. Насколько они надежны, подлежит обсуждению, с проблемами, такими как галлюцинации и другие. Однако хорошая новость заключается в том, что, по опыту автора, масштабирование повышает надежность.

Человечество в настоящее время вкладывает капитал в масштабирование авторегрессивных моделей. Microsoft вкладывает много капитала в проект Stargate совместно с OpenAI, а Сэм Алтман ищет 7 триллионов долларов в капитал (хотя это, вероятно, заголовок для привлечения внимания). Пока масштаб продолжает расти, надежность этих моделей мира должна улучшаться.

Автор полагает, что модели мира, которые у нас есть сейчас, достаточны для построения в целом интеллектуального агента. Он также полагает, что надежность можно дополнительно улучшить за счет взаимодействия мышления системы 2 (глубокого, преднамеренного рассуждения) и наблюдения за реальным миром - парадигма, которая еще не была замечена в ИИ, но является ключевым механизмом для повышения надежности.

Хотя скептики LLM, такие как Ян ЛеКун, говорят, что мы еще не достигли интеллекта кошки, автор утверждает, что LLM могли бы изучить это знание, имея возможность для самосовершенствования. Он считает, что это возможно с трансформерами и правильными ингредиентами.

Скептики, трансформеры и путь к ИИ общего назначения

Хотя скептики LLM, такие как Ян ЛеКун, говорят, что мы еще не достигли интеллекта кошки, это упускают из виду. Да, LLM все еще не хватает некоторых базовых знаний, которыми обладает каждая кошка, но они могли бы изучить эти знания, имея возможность для самосовершенствования. Такое самосовершенствование возможно с трансформерами и правильными ингредиентами.

Нет общеизвестного способа достичь "мышления системы 2" - долгосрочного рассуждения, которое необходимо ИИ-системам для эффективного достижения целей в реальном мире. Однако автор достаточно уверен, что это возможно в парадигме трансформеров с доступными технологиями и вычислительными мощностями. Он ожидает значительного прогресса в этом направлении в ближайшие 2-3 года.

Аналогичным образом, автор оптимистично настроен в отношении краткосрочных достижений в области воплощения. Происходит конвергенция между областями робототехники и LLM, что видно в впечатляющих демонстрациях, таких как недавний робот Digit. Крупные языковые модели могут сопоставлять произвольные сенсорные входы с командами для сложных робототехнических систем.

Автор тестировал знания GPT-4 о физическом мире, взаимодействуя с ним через камеру смартфона. Хотя это не идеально, он оказался на удивление способным, и автор полагает, что в ближайшие 1-2 года мы увидим впечатляющий прогресс в развертывании систем, которые могут предпринимать последовательные действия в среде и наблюдать результаты.

Важность мышления Системы 2

Автор подчеркивает критическую роль "мышления системы 2" в построении в целом интеллектуальных агентов. Мышление системы 2 относится к механизму проведения глубокой интроспекции и рассуждений на произвольные темы, в отличие от более интуитивного "мышления системы 1", которое полагается на быстрые, автоматические реакции.

Автор утверждает, что для того, чтобы агент был в целом интеллектуальным, ему необходимо иметь способ взаимодействия и наблюдения за средой (воплощение), надежную модель мира, охватывающую среду (интуиция/мышление системы 1), и механизм для глубокой интроспекции и рассуждений (мышление системы 2).

Конкретно, автор заявляет, что с доступными в настоящее время моделями мира он подозревает, что они достаточны для построения в целом интеллектуального агента. Однако ключевым недостающим звеном является способность мышления системы 2. Автор уверен, что достижение эффективного мышления системы 2 в парадигме трансформеров возможно с учетом имеющихся технологий и вычислительных мощностей.

Автор оценивает, что разработка надежного механизма мышления системы 2 займет 2-3 года. В сочетании с 1-2 годами для улучшения возможностей воплощения, автор прогнозирует, что мы могли бы увидеть появление в целом интеллектуального, воплощенного агента в течение 3-5 лет. Это стало бы важной вехой на пути к ИИ общего назначения.

Воплощение и конвергенция робототехники и языковых моделей

Автор выражает оптимизм в отношении краткосрочных достижений в области воплощения ИИ-систем. Он отмечает происходящую конвергенцию между областями робототехники и крупных языковых моделей (LLM).

Автор подчеркивает недавние впечатляющие демонстрации, такие как робот Figure, который объединил знания GPT-4 с плавными физическими движениями. Он также упоминает недавно выпущенный Unitary H1, аватар ИИ-агента, напоминающий робота Boston Dynamics.

Автор объясняет, что крупные омниканальные модели могут сопоставлять произвольные сенсорные входы с командами, которые могут быть отправлены в сложные робототехнические системы. Это позволяет развертывать системы, которые могут выполнять последовательные действия в среде и наблюдать и понимать результаты.

Автор тестировал знания GPT-4 о физическом мире, взаимодействуя с ним через камеру смартфона. Хотя это не идеально, он находит его на удивление способным и предполагает, что в ближайшие 1-2 года мы увидим впечатляющий прогресс в этой области.

Автор резюмирует, что мы в основном решили проблему построения моделей мира, и у нас есть 2-3 года, чтобы достичь эффективного мышления системы 2 (долгосрочного рассуждения). Одновременно он ожидает 1-2 года прогресса в области воплощения. Как только эти ключевые компоненты будут на месте, интеграция их в описанный ранее циклический алгоритм займет еще 1-2 года.

В целом, текущая оценка автора для достижения ИИ общего назначения составляет 3-5 лет, с уклоном в сторону 3 лет для чего-то, напоминающего в целом интеллектуального воплощенного агента, что он лично считал бы ИИ общего назначения. Однако он признает, что может потребоваться еще несколько лет, чтобы убедить более скептически настроенных фигур, таких как Гэри Маркус.

Часто задаваемые вопросы