Компания Apple вошла в состав совета директоров OpenAI, взлом OpenAI, джейлбрейки и другие новости об ИИ

Откройте для себя последние новости и разработки в области искусственного интеллекта, включая место Apple в совете директоров OpenAI, достижения в области ИИ на устройствах, новый инструмент для изоляции голоса и проблемы безопасности, связанные с внутренним взломом OpenAI. Исследуйте развивающийся ландшафт вычислений на основе ИИ и его влияние на будущее медиа и технологий.

24 февраля 2025 г.

party-gif

Этот блог-пост предлагает всестороннее обзор последних событий в индустрии ИИ, охватывая широкий спектр тем от участия Apple в OpenAI до выпуска новых моделей и инструментов ИИ. Читатели получат представление об эволюционирующем ландшафте технологий ИИ, включая достижения в обработке ИИ на устройстве, голосовых возможностях и генерации 3D-активов. Кроме того, в сообщении рассматриваются важные проблемы безопасности и нарушения в сообществе ИИ, предоставляя всестороннюю перспективу на текущее состояние этой области.

Apple Присоединяется к Совету OpenAI: Неожиданный Шаг

Сообщается, что Apple получает место наблюдателя в совете директоров OpenAI. Это неожиданный шаг, так как Microsoft пришлось купить половину OpenAI, чтобы получить место в совете директоров, в то время как Apple не платит ничего OpenAI, но все же получает место в совете. Это место было выбрано для Фила Шиллера, бывшего директора по маркетингу Apple.

Эта новость интересна, потому что после объявлений Apple об ИИ было ясно, что они держат OpenAI на расстоянии вытянутой руки в плане их партнерства. Все думали, что ChatGPT будет глубоко интегрирован в экосистему Apple, но оказалось, что Apple разработала много собственного искусственного интеллекта для работы на своих устройствах и в своем частном облаке. Любая задача, требующая знаний о мире, передается и отправляется в API OpenAI, но только после подтверждения намерений пользователя каждый раз.

Кажется, что Apple получает лучшее из обоих миров - они используют возможности OpenAI, а также разрабатывают собственные решения на основе ИИ. Этот шаг свидетельствует о том, что Apple обходит всех и стратегически позиционирует себя на ландшафте ИИ.

Salesforce Представляет Einstein Tiny Giant: Рост Локального ИИ

Марк Бениофф, генеральный директор Salesforce, объявил о запуске Salesforce Einstein Tiny Giant, модели с 1 миллиардом параметров, которая превосходит модели, в семь раз превышающие ее размер, включая GPT-3.5 и Claude, по производительности на устройстве. Это развитие является значительным шагом к будущему обработки ИИ, где меньшие и более эффективные модели будут играть решающую роль.

Основные особенности Salesforce Einstein Tiny Giant:

  • Это модель с 1 миллиардом параметров, что делает ее "микро" моделью в мире больших языковых моделей.
  • Несмотря на меньший размер, она превосходит более крупные модели, такие как GPT-3.5 и Claude, по производительности на устройстве.
  • Эта модель представляет собой рост обработки ИИ на устройстве, когда вычисления выполняются локально на устройстве пользователя, а не на основе облачной инфраструктуры.
  • Обработка ИИ на устройстве предлагает ряд преимуществ, включая улучшенную конфиденциальность, безопасность, низкую задержку и эффективность по затратам.
  • Видение Бениоффа для будущего стека ИИ предполагает сочетание более мелких, специализированных моделей, управляемых генералистской моделью, что обеспечивает максимальную эффективность и производительность.
  • Доступность открытых микромоделей, таких как Salesforce Einstein Tiny Giant, является важным шагом к реализации этого видения стека ИИ будущего.

В целом, представление Salesforce Einstein Tiny Giant является свидетельством растущей важности обработки ИИ на устройстве и потенциала более мелких, специализированных моделей для превосходства над их более крупными аналогами в определенных случаях использования.

Moshi от Open Science: Опережая OpenAI в Голосовых Возможностях

Компания под названием Open Science, похоже, опередила OpenAI в полноценных голосовых возможностях. Они выпустили Moshi, настоящую многомодальную модель Foundation в реальном времени, которая может слушать и говорить, аналогично тому, что OpenAI продемонстрировал с GPT-4 в мае. Однако функциональность голоса GPT-4 задерживается, и неясно, когда она будет выпущена.

Moshi имеет несколько впечатляющих функций:

  • Выражает и понимает эмоции
  • Говорит с французским акцентом
  • Слушает и генерирует речь
  • Думает, пока говорит
  • Поддерживает два аудиопотока для одновременного прослушивания и речи
  • Совместная предварительная подготовка на синтетических данных, доработанная на 100 000 устных синтетических разговоров, преобразованных с помощью TTS
  • Обучил свой голос на синтетических данных, сгенерированных отдельной моделью TTS
  • Конечная задержка 200 миллисекунд
  • Меньшая версия, которая работает на MacBook или потребительском GPU
  • Использует водяные знаки для обнаружения аудио, сгенерированного ИИ
  • Скоро будет полностью открыт с исходным кодом, включая демо, код, модель и статью

Хотя автор попробовал демо и обнаружил, что оно непоследовательно, он с нетерпением ждет возможности протестировать его снова, как только будет доступна открытая версия. Возможность иметь многомодальную модель Foundation в реальном времени, которая может слушать и говорить, является значительным достижением, и будет интересно посмотреть, как Moshi будет работать по сравнению с будущими голосовыми возможностями OpenAI.

Будущее Вычислений: Сдвиг Парадигмы

По словам Эндрю Карпати, ведущего голоса в области искусственного интеллекта и соучредителя OpenAI, природа вычислений претерпевает фундаментальные изменения. Мы вступаем в новую парадигму вычислений, аналогичную 1980-м годам в области вычислительной техники.

Вместо центрального процессорного устройства, работающего с инструкциями по байтам, у нас теперь есть большие языковые модели, которые выступают в качестве центрального процессорного устройства, работая с токенами (небольшими фрагментами строк) вместо байтов. Кроме того, у нас есть окно контекста токенов вместо оперативной памяти байтов и эквиваленты других компонентов вычислительной техники.

Карпати называет этот новый "компьютер" большой языковой моделью (LLM) и видит в этом новую систему, которую мы все учимся программировать. Понимание ее сильных и слабых сторон, а также эффективное включение ее в продукты будет иметь решающее значение в ближайшие годы.

Этот сдвиг в парадигме вычислений предполагает, что традиционные операционные системы и приложения могут больше не быть необходимыми. Будущее может заключаться в непосредственном общении с большой языковой моделью, которая затем может выполнять желаемые вычисления на любом конечном устройстве без необходимости традиционной разработки программного обеспечения.

Это видение будущего ставит под сомнение текущую роль разработчиков, поскольку Карпати считает, что потребность в разработчиках может значительно уменьшиться в течение следующих 10 лет. Ландшафт вычислений эволюционирует, и способность эффективно использовать большие языковые модели будет ключевым фактором инноваций и прогресса в ближайшие годы.

Инновационные Аудио-Инструменты 11 Labs: Изоляция Голоса и Известные Голоса

11 Labs, компания, занимающаяся голосовыми технологиями ИИ, выпустила два новых захватывающих продукта:

  1. Voice Isolator: Этот инструмент может записывать речь и извлекать кристально чистый голос из любого аудиообразца, даже с существенным фоновым шумом. Демонстрация показывает его способность удалять фоновый шум и обеспечивать высококачественное аудио, что может быть невероятно полезно для записи интервью или видеозвонков в шумных условиях.

  2. Famous Voices: 11 Labs привносит знаменитые голоса в свое приложение для iOS, позволяя пользователям заставлять легендарных голливудских икон, таких как Джеймс Дин, Джуди Гарленд, Берт Рейнольдс и сэр Лоуренс Оливье, говорить все, что они хотят. Эта функция демонстрирует будущее медиа, где владельцы интеллектуальной собственности могут продавать права на воспроизведение голоса и внешности человека компаниям, занимающимся ИИ.

Эти инновационные аудиоинструменты от 11 Labs демонстрируют достижения в голосовых технологиях и потенциал ИИ для трансформации различных отраслей, от создания контента до коммуникации. Возможности изоляции голоса могут значительно улучшить качество аудиозаписей, в то время как функция знаменитых голосов открывает новые возможности для персонализированных медиа-впечатлений.

Perplexity Pro Search: Продвижение Многоэтапного Рассуждения и Кодовых Возможностей

Perplexity объявила об обновленной версии Pro Search, которая может проводить более глубокие исследования по более сложным запросам с многошаговым рассуждением, а также расширенными математическими и программными возможностями.

Основные функции обновленного Perplexity Pro Search включают:

  1. Многошаговое рассуждение: Система теперь подходит к сложным проблемам с более глубоким многошаговым рассуждением. Она понимает, когда вопрос требует планирования, работает поэтапно над целями и синтезирует более глубокие ответы с большей эффективностью.

  2. Wolfram Alpha и выполнение кода: Perplexity Pro Search добавил расширенные математические и программные возможности, позволяющие решать сложные задачи, требующие выполнения кода, такие как проблема "ночного набора" для 100 прыжков.

  3. Улучшенная обработка запросов: Обновленная система может справляться с более сложными запросами, разбивая их на несколько шагов, чтобы предоставлять всесторонние и хорошо продуманные ответы.

Эти улучшения делают Perplexity Pro Search более мощным инструментом для исследований, способным решать сложные вопросы, требующие планирования, рассуждений и интеграции различных источников информации. Добавление расширенных математических и кодовых возможностей еще больше расширяет способности системы к решению задач.

Хотя автор не использовал Perplexity в значительной степени, обновленные функции предполагают, что это может быть ценным ресурсом для тех, кто ищет глубокие, многоаспектные ответы на сложные запросы. Решение об использовании Perplexity Pro Search будет зависеть от индивидуальных потребностей и ценности, которую он предоставляет по сравнению с другими доступными инструментами.

Meta 3D Gen: Трансформация Создания 3D-Активов

Meta, технологический гигант, представил революционную новую систему под названием Meta 3D Gen. Этот инновационный инструмент, работающий на основе ИИ, предназначен для радикального изменения способа создания 3D-активов, предлагая бесшовное и эффективное комплексное решение.

Meta 3D Gen - это комбинированная система ИИ, которая может генерировать высококачественные 3D-активы, включая детальные текстуры и карты материалов, все из простых текстовых подсказок. Эта примечательная возможность позволяет создателям производить потрясающий 3D-контент за долю времени, которое обычно требуется с использованием традиционных методов.

Производительность системы действительно впечатляет, с возможностью генерировать результаты, превосходящие существующие решения, при этом работая в 3-10 раз быстрее. Это значительное повышение эффективности и качества является революционным для индустрии создания 3D-активов.

Используя силу ИИ, Meta 3D Gen позволяет создателям сосредоточиться на своем творческом видении, а не утопать в технических сложностях 3D-моделирования и текстурирования. Этот сдвиг в творческом рабочем процессе может открыть новые возможности и вдохновить новую эру создания 3D-контента.

Meta дополнительно укрепила этот проект, опубликовав два исследовательских документа, связанных с Meta 3D Gen, предоставляющих ценные идеи и технические детали для более широкого сообщества для изучения и развития.

По мере эволюции медиа-ландшафта способность динамически и по запросу генерировать 3D-активы станет ключевым активом. Возможности Meta 3D Gen соответствуют растущей тенденции к персонализированному и адаптированному контенту, где видеоигры, фильмы и другие медиа могут генерироваться в режиме реального времени для удовлетворения индивидуальных предпочтений.

Эта инновационная технология от Meta является свидетельством приверженности компании к расширению границ того, что возможно в области создания 3D-активов. С Meta 3D Gen будущее медиа и создания контента готово к трансформирующему сдвигу.

GPT-4All 3.0: Открытое Программное Обеспечение Локального LLM Рабочего Стола

Оригинальный проект, который

Часто задаваемые вопросы