Новости ИИ: Насыщенная неделя в области достижений и разработок ИИ

Откройте для себя последние достижения и разработки в области искусственного интеллекта за прошедшую неделю, включая расширенную голосовую функцию OpenAI, возможности длительного вывода GPT-4, заявления Microsoft о конкуренции в области ИИ, а также обновления от Google, Anthropic, Meta и других. Будьте на шаг впереди в постоянно развивающемся мире ИИ.

24 февраля 2025 г.

party-gif

Этот блог-пост предоставляет всеобъемлющий обзор последних достижений в мире ИИ, охватывая широкий спектр тем от новых голосовых функций в ChatGPT от OpenAI до приобретения Leonardo AI компанией Canva. Читатели получат представление о быстро развивающемся ландшафте ИИ и захватывающих разработках, которые формируют будущее этой технологии.

Расширенная голосовая функция Open AI

Open AI начал внедрять расширенную голосовую функцию для небольшого числа пользователей. Эта новая функция позволяет пользователям генерировать голоса, похожие на человеческие, включая возможность имитировать голоса, такие как голос Скарлетт Йоханссон.

Основные особенности расширенного голосового режима:

  • Пользователи с доступом могут попробовать опцию "Расширенный голосовой режим" в нижней части окна чата.
  • Он может генерировать очень реалистичные голоса, включая возможность имитировать голоса знаменитостей и общественных деятелей.
  • Пользователи могут прерывать голос во время его воспроизведения, функция, недоступная в стандартном приложении чата GPT.
  • Демонстрации показывают, что голосовая модель может считать очень быстро, даже имитируя необходимость сделать вдох.

Длинный вывод GPT-4

Open AI недавно выпустил экспериментальную версию GPT-4, называемую "GPT-4 Long Output". Эта новая модель имеет максимальный выход 64 000 токенов на запрос, что позволяет получать гораздо более длинные и подробные ответы по сравнению со стандартной моделью GPT-4.

Модель GPT-4 Long Output в настоящее время доступна только для ограниченной группы участников Alpha и пока не доступна для широкой публики. Эта экспериментальная версия предназначена для предоставления пользователям возможности генерировать чрезвычайно длинные и всеобъемлющие выходные данные в ответ на их запросы.

Хотя подробности архитектуры модели и процесса ее обучения не были раскрыты публично, увеличение длины выходных данных, вероятно, достигается за счет совершенствования возможностей модели в области памяти и рассуждений. Это позволяет модели поддерживать контекст и связность на гораздо более длинном отрезке текста, что позволяет ей предоставлять более подробные и глубокие ответы.

Потенциальные приложения модели GPT-4 Long Output обширны, от расширенных исследовательских и аналитических задач до генерации контента длинной формы, такого как отчеты, эссе или даже книги. Однако, как и с любой мощной технологией ИИ, существуют также опасения по поводу возможного неправильного использования или непреднамеренных последствий такой модели.

Open AI как конкурент Microsoft

На этой неделе Microsoft заявляет, что Open AI является конкурентом в области ИИ и поиска. Это интересно, потому что Microsoft инвестировал 13 миллиардов долларов в Open AI и владеет 49% компании.

В своих финансовых отчетах Microsoft перечислил компании, включая Anthropic, Open AI, Meta и другие открытые источники, как конкурентов для своих предложений ИИ. Это странно видеть, поскольку Open AI на 49% принадлежит Microsoft, и у них также есть партнерские соглашения с Meta.

Кажется, что Microsoft теперь рассматривает Open AI как конкурента своего бизнеса по поиску и рекламе новостей, хотя у них есть значительная доля в компании. Это очень интересная динамика, которая развивается между двумя компаниями.

Одобрение Open AI регулирования ИИ

На этой неделе Open AI поддержал несколько законопроектов Сената, связанных с регулированием и безопасностью ИИ. Это включает Закон о будущем инноваций в ИИ, который официально уполномочит Институт безопасности ИИ США как федеральный орган для установления стандартов и руководящих принципов для моделей ИИ.

Open AI также поддержал Закон об образовании в области ИИ NSF и Закон о CREATE AI, которые предоставляют федеральные стипендии для исследований в области ИИ и создают образовательные ресурсы по ИИ в колледжах и школах K-12.

Эти одобрения со стороны Open AI, вероятно, служат для того, чтобы помочь компании занять место за столом в будущих дискуссиях о регулировании ИИ. Как крупная компания в области ИИ, Open AI, вероятно, станет объектом регулятивного надзора в будущем. Одобряя эти законопроекты, Open AI может помочь определить направление регулирования и обеспечить представительство своих интересов.

Кроме того, Open AI пообещал предоставить Институту безопасности ИИ США ранний доступ к своей следующей модели. Это, похоже, является попыткой противодействовать нарративу о том, что Open AI отодвинул безопасность ИИ на второй план в погоне за более мощными генеративными технологиями ИИ.

Anthropic запускает Claud в Бразилии

Хорошие новости для жителей Бразилии - Anthropic запустил своего помощника ИИ Claud в стране на этой неделе. Claud теперь доступен для пользователей в Бразилии для доступа и взаимодействия.

Google's Gemini 1.5 Pro и другие модели ИИ

Google также на этой неделе наделал много шума в мире ИИ. Они выпустили новую версию Gemini 1.5 Pro, назвав ее версией 0801, которая доступна для использования прямо сейчас внутри Google AI Studio.

Чтобы получить к ней доступ, вы можете перейти на ai.studio.google.com и в раскрывающемся меню "Модель" вы увидите "Gemini 1.5 Pro experimental 0801" - вот эту модель вы и хотите использовать.

Когда вы общаетесь с этой новой моделью Gemini 1.5 Pro, она возглавила рейтинг на lm.org, даже превзойдя GPT-4, GPT-4 Mini, CLAE 3.5 и Sonet.

Google также на этой неделе выпустил новую меньшую версию своей модели Gemini 2 - модель с 2 миллиардами параметров, построенную для более быстрой производительности и эффективности, вероятно, для мобильных устройств. Интересно, что эта модель с 2 миллиардами параметров превосходит гораздо более крупные модели, такие как Mixdral 8X 7B, GPT-3.5 Turbo и LLaMA 2 70 миллиардов.

Помимо новых моделей Gemini, Google добавил некоторые впечатляющие новые функции AI Chrome на этой неделе, включая интеграцию Google Lens, которая может идентифицировать и искать объекты на изображениях, и новую функцию сравнения, которая может сравнивать продукты на разных веб-сайтах.

Новые функции ИИ в Google Chrome

На этой неделе Google добавил несколько новых функций, управляемых ИИ, в свой браузер Chrome:

  1. Google Lens в настольном Chrome: Теперь вы можете использовать Google Lens для поиска информации об объектах на изображениях прямо из браузера Chrome. Просто выберите область изображения, и Lens будет искать похожие продукты или идентифицировать объект.

  2. Сравнение продуктов: Chrome теперь имеет встроенную функцию, которая позволяет сравнивать продукты на разных вкладках и веб-сайтах. Это упрощает исследование и сравнение товаров без необходимости переключаться между вкладками.

  3. Поиск истории в естественном языке: Теперь вы можете использовать естественный язык для поиска в истории просмотров Chrome. Например, вы можете спросить: "Какое мороженое я искал на прошлой неделе?" и Chrome выдаст соответствующую информацию из вашей истории поиска.

Meta убивает чат-боты ИИ и новая студия ИИ

На этой неделе Meta отказалась от одной из функций, которую она анонсировала на прошлогоднем Meta Connect. Они показывали чат-боты, которые выглядели как известные люди, но на самом деле это были не настоящие чат-боты этих знаменитостей - они просто использовали их лицо, но были обучены на другой информации. Однако никому это не понравилось, поэтому Meta от этого отказалась.

Но они заменили это чем-то другим - теперь любой может создать свой собственный пользовательский ИИ. Meta запустила AI Studio, и один из моих друзей, Дон Аллен Стивенсон, является одним из тех, кто получил ранний доступ.

Эта новая функция позволяет любому создавать персонажей ИИ на основе своих интересов. Вы можете перейти на ai.meta.com/AI-Studio и создать своего собственного пользовательского персонажа ИИ, выбирая варианты, такие как питомец ИИ, частный репетитор, фанат, творческий художник, консультант, креативный дизайнер, личный стилист и многое другое.

Процесс генерирует изображение персонажа с помощью ИИ, дает ему имя и слоган, а затем вы можете дополнительно настроить и разработать, что вы хотите, чтобы этот ИИ делал. Пока это кажется немного как новинка, так как вы не можете легко импортировать большие документы или расшифровки, чтобы позволить людям общаться с аватаром ИИ-версией вас. Но, вероятно, именно к этому они и пытаются прийти в будущем.

Более впечатляющее, что Meta выпустила на этой неделе, - это их новая модель Segment Anything Model 2 (SAM 2). Это модель, которая может с впечатляющей точностью сегментировать определенные участки изображения или видео, даже отслеживая объекты по мере их перемещения. Это большое улучшение по сравнению с предыдущими моделями сегментации и может быть очень полезно для задач видеомонтажа, таких как ротоскопирование. Вы можете попробовать SAM 2 на sam2.metademolab.com.

Модель Segment Anything Model 2 от Meta

Meta выпустила новую версию своей модели Segment Anything, называемую SAM 2. Эта обновленная модель демонстрирует значительные улучшения в ее способности точно сегментировать объекты на изображениях и видео.

Некоторые ключевые особенности SAM 2:

  • Улучшенная способность отслеживать объекты через окклюзию - модель может продолжать следить за объектом, даже когда он временно скрывается за другим объектом.
  • Повышенная точность сегментации, позволяющая более точно очерчивать границы обнаруженных объектов.
  • Более высокая скорость обработки, что позволяет проводить сегментацию в реальном времени в видеоприложениях.
  • Расширенная универсальность, позволяющая модели сегментировать широкий спектр объектов, от людей и животных до более сложных форм и структур.

Демонстрации, предоставленные Meta, демонстрируют впечатляющие возможности SAM 2. Например, модель может точно отслеживать скейтбордиста, когда он перемещается по сцене, сохраняя сегментацию даже когда скейтбордист проходит за деревом. Аналогичным образом она может изолировать и отслеживать несколько мячей на видео, различая каждый из них индивидуально.

Программа издателей Perplexity

Perplexity, поисковая система на базе ИИ, объявила о программе Perplexity Publishers Program. Эта программа направлена на распределение доходов с определенными партнерами, контент которых используется в качестве источника новостей на платформе Perplexity.

Первоначальный пул партнеров, включенных в эту программу, включает:

  • Time
  • Der Spiegel
  • Fortune
  • Entrepreneur
  • The Texas Tribune
  • WordPress.com

Хотя эта программа в настоящее время включает только крупных издателей, Perplexity выразила надежду, что в будущем она сможет стимулировать обычных блогеров и создателей контента лицензировать свой контент для этой платформы. Однако на данный момент Perplexity Publishers Program сосредоточен на установленных новостных организациях.

Leonardo AI приобретен Canva

На этой неделе большая новость заключается в том, что Leonardo AI, один из ведущих инструментов для генерации изображений с помощью ИИ, был приобретен платформой дизайна Canva. Это значительное событие по нескольким причинам:

  1. Интеграция с Canva: С Leonardo AI, теперь являющимся частью экосистемы Canva, пользователи в конечном итоге смогут получить доступ к мощным возможностям генерации изображений непосредственно в платформе Canva. Это упростит создание высококачественных изображений, сгенерированных с помощью ИИ, без необходимости переключаться между несколькими инструментами.

  2. Улучшение ИИ-возможностей Canva: Текущие возможности Canva по генерации изображений с помощью ИИ были несколько

Часто задаваемые вопросы