Прорывные чипы ИИ, задержка голоса GPT-4, доминирование Клода 3.5 и игры на основе ИИ

Исследуйте последние достижения в области искусственного интеллекта, включая мощные чипы ИИ, задержку голоса OpenAI, доминирование Клода 3.5 и инновации в области игр на основе ИИ. Будьте в курсе быстро развивающегося ландшафта ИИ.

24 февраля 2025 г.

Откройте для себя последние достижения в области технологий искусственного интеллекта, от прорывных чипов ИИ и голосовых возможностей до доминирования моделей ИИ в разработке кода и разработке видеоигр. Этот блог-пост предоставляет всеобъемлющий обзор самых значительных новостей об ИИ, оснащая вас знаниями, чтобы оставаться на шаг впереди кривой.

Новый чип AI, который превосходит GPU
Задержка в голосовых возможностях OpenAI
Доминирование модели Anthropic's Claude 3.5
Видеоигровые кадры, сгенерированные AI
Опасения Apple по поводу интеграции AI Meta

Новый чип AI, который превосходит GPU

Первая история сегодня о новой компании по производству чипов ИИ под названием Etched, которая утверждает, что может генерировать более 500 000 токенов в секунду при работе с LLaMA 70B. Этот чип, называемый Sohu, является первой специализированной ASIC (интегральная схема специального назначения) для моделей Transformer.

Сообщается, что Sohu более чем в 10 раз быстрее и дешевле даже следующего поколения GPU Nvidia Blackwell. Один сервер Sohu может обрабатывать более 500 000 токенов LLaMA 70B в секунду, что в 20 раз больше, чем Nvidia H100, и в 10 раз больше, чем Blaize B2.

Основное преимущество Sohu заключается в его специализации на моделях Transformer, которые являются основой большинства ведущих продуктов ИИ сегодня. Компания утверждает, что по мере того, как модели Transformer становятся более доминирующими, специализированные чипы, такие как Sohu, будут иметь решающее значение, поскольку GPU не улучшаются в плотности вычислений достаточно быстро, чтобы успевать за ними.

Etched считает, что архитектура, которая обеспечивает самую быструю и дешевую работу Transformer на оборудовании, выиграет "лотерею оборудования". Они утверждают, что лаборатории ИИ тратят сотни миллионов на оптимизацию ядер для Transformer, а стартапы используют специализированные библиотеки программного обеспечения Transformer, что затрудняет "убийцам Transformer" догнать их на GPU.

Задержка в голосовых возможностях OpenAI

OpenAI объявила о задержке в развертывании расширенного голосового режима для ChatGPT, который ранее был продемонстрирован во время весеннего обновления. Компания ссылается на необходимость улучшить способность модели обнаруживать и отказываться от определенного контента, а также улучшить пользовательский опыт и подготовить инфраструктуру для масштабирования до миллионов пользователей при сохранении ответов в режиме реального времени.

Компания планирует начать развертывание альфа-версии расширенного голосового режима для небольшой группы пользователей ChatGPT Plus в конце июня, с целью сделать его доступным для всех пользователей Plus осенью. Однако точные сроки будут зависеть от соответствия их высоким стандартам безопасности и надежности.

OpenAI также работает над развертыванием новых возможностей видео и совместного использования экрана, которые будут объявлены отдельно. Ожидается, что расширенный голосовой режим приблизит ChatGPT к реальным, естественным разговорам с ИИ, с возможностью понимать и реагировать с эмоциями и невербальными сигналами.

Задержка в запуске этих функций разочаровывает, так как она перекликается с затянувшимся ожиданием выпуска Whisper, голосовой модели OpenAI. Тем не менее, компания подчеркивает важность обеспечения высокого уровня безопасности и надежности перед широким распространением этих возможностей.

Доминирование модели Anthropic's Claude 3.5

Модель Claude 3.5 от Anthropic совершила значительный скачок, заняв первое место в Арене сложных промптов для кодирования Arita и второе место в общем рейтинге. Новая модель Sonet превзошла Opus по стоимости, что делает ее конкурентоспособной с моделями Frontier, такими как GPT-4 и Gemini 1.5 Pro, во всех областях.

В предыдущем видео создатель протестировал модель Claude 3.5 Sonet и обнаружил, что это лучшая модель, которую он когда-либо тестировал. Модель полностью разгромила тесты создателя, что побудило его запросить новые, более сложные тесты.

Сравнение Claude 3.5 и GPT-4 в задачах кодирования показывает, что Claude 3.5 превосходит GPT-4 по успешности выполнения задач и полному успеху проекта, хотя GPT-4 имеет немного более высокую скорость сборки. Кроме того, Claude 3.5 более многословен, что может быть полезно для более длинных фрагментов кода, но может замедлить генерацию. Модель также менее надежна в следовании инструкциям в больших промптах по сравнению с GPT-4.

В целом, доминирование модели Claude 3.5 от Anthropic в областях кодирования и сложных промптов является значительным достижением, демонстрирующим продолжающееся развитие больших языковых моделей и их применений.

Видеоигровые кадры, сгенерированные AI

Видео, продемонстрированное пользователем Twitter chubby, действительно примечательно, поскольку оно демонстрирует невероятные возможности ИИ в генерации реалистичных видеоигровых кадров. Визуальные эффекты, которые, по-видимому, вдохновлены игрой в стиле Call of Duty, поразительно реалистичны, при этом сгенерированные ИИ звук и визуальные эффекты органично сливаются, создавая погружающий опыт.

Хотя качество кадров впечатляет, количество вычислительной мощности, необходимой для достижения такого уровня реализма в режиме реального времени, по-прежнему является значительной проблемой. Как упомянул Дженсен, генеральный директор Nvidia, это будущее видеоигр, и оно выведет индустрию на новые высоты.

Видео подчеркивает быстрый прогресс в области генерации контента с помощью ИИ, где грань между реальностью и искусственным творением становится все более размытой. По мере развития технологии мы можем ожидать еще более впечатляющих и реалистичных видеоигровых сценариев, созданных с помощью ИИ, в ближайшем будущем.

Опасения Apple по поводу интеграции AI Meta

Apple решила не интегрировать модели ИИ Meta, такие как модель Llama 3, в Siri из-за опасений по поводу конфиденциальности. Это решение последовало всего через несколько дней после сообщений о том, что Apple ведет переговоры с Meta об интеграции моделей ИИ последней.

Основной причиной решения Apple являются опасения компании по поводу практики Meta в отношении конфиденциальности пользователей. Apple неоднократно критиковала подход Meta к конфиденциальности пользователей, и технологический гигант, вероятно, не хочет ассоциироваться с компанией, которая сталкивалась с многочисленными скандалами, связанными с конфиденциальностью.

Даже несмотря на то, что Apple могла бы размещать модели ИИ самостоятельно и сохранять контроль над аспектами конфиденциальности, компания все же отказалась от интеграции. Это свидетельствует о том, что опасения Apple выходят за рамки просто технической реализации и распространяются на более широкие репутационные риски партнерства с Meta.

Это решение подчеркивает приверженность Apple конфиденциальности пользователей и ее готовность отказаться от потенциальных возможностей ИИ, если они идут в ущерб ее основным ценностям. Оно также подчеркивает растущую важность конфиденциальности в технологической отрасли, поскольку компании балансируют между инновациями и защитой данных пользователей.

Часто задаваемые вопросы

Как называется новый чип AI, который, как утверждается, генерирует более 500 000 токенов в секунду при работе с Llama 70b?

Когда будет доступен расширенный голосовой режим для ChatGPT от OpenAI?

Каковы ключевые выводы из нового открытого рейтинга LLM, созданного Hugging Face?

Какое последнее обновление производительности Claude 3.5 от Anthropic?

Почему Apple решила не интегрировать модели AI Meta в Siri?

Создайте свою девушку с искусственным интеллектом

Создайте своего идеального компаньона с помощью нашего AI Girlfriend Builder.