OpenAIのSearchGPT、Mistral Large 2、そして最新のAI技術革新

最新のAI技術の進展を探る。OpenAIのSearchGPT、Mistral Large 2、Google DeepMindの数学的問題解決能力など。大規模言語モデルの進化と、AIの未来への影響について深く掘り下げる。

2025年2月24日

party-gif

AIの世界における最新の進歩を発見しましょう。OpenAIの画期的なSearchGPTプロトタイプから、Mistral Large 2の驚くべき機能、AlphaProofの複雑な数学的問題解決における優位性まで。最先端のイノベーションを探索し、人工知能の未来を先取りしましょう。

OpenAIのSearchGPT - 新しい検索AIプロトタイプ

OpenAIは、自社のAIモデルの強みとウェブからの情報を組み合わせて、迅速かつタイムリーな回答と明確で関連性の高い情報源を提供することを目的とした新しいプロトタイプ「SearchGPT」の発表を行いました。

この新しい検索機能は、現在ChatGPTをバックエンドとして使用しているPerplexityなどのサービスに直接対抗するものです。OpenAIがこのような検索重視の製品を発表することは、Google などの従来の検索エンジンに対する直接的な挑戦となります。

SearchGPTの主な特徴は以下の通りです:

  • 迅速かつタイムリーな回答: プロトタイプは、ユーザーの質問に迅速かつ直接的に回答し、ウェブからの最新情報を提供するように設計されています。
  • 関連情報源: SearchGPTは、回答の根拠となる関連情報源へのリンクを提供し、さらなる探索を可能にします。
  • 会話形式のやり取り: ユーザーは追加の質問をすることができ、質問ごとに共有コンテキストを築いていくことで、人との会話のようなやり取りが可能です。
  • シンプルなインターフェース: プロトタイプには、ユーザーが検索機能を簡単に操作できるシンプルで直感的なインターフェースが採用されています。

OpenAIによるこの動きは、同社がLanguage Modelを超えて検索市場への進出を目指していることを明確に示しています。SearchGPTの潜在的な優位性、すなわちウェブ検索機能や会話形式のやり取りは、特にChatGPTのようなLarge Language Modelに依存しているユーザーにとって、既存の検索エンジンに対する大きな挑戦となる可能性があります。

Mistral Large 2 - 強力なAIモデル

AI研究企業のMistralは、最新世代のフラッグシップモデル「Mistral Large 2」の発表を行いました。前世代と比べ、言語生成、数学、推論などの分野で大幅な性能向上を実現しています。また、多言語サポートや高度な関数呼び出し機能も大幅に強化されています。

ベンチマークスコアによると、Mistral Large 2は非常に優れた性能を発揮しており、コード生成精度の平均が76.9%に達しています。これは、強力なGPT-4モデルの77.9%とほぼ同等の水準です。興味深いことに、このハイパフォーマンスモデルのパラメータ数は、より大規模なLlama 3.1 405Bモデルよりも少ないことが示されており、Mistralチームの効率的な取り組みを物語っています。

Mistral Large 2は、長いコンテキストウィンドウを必要とするアプリケーションを対象として設計されており、数十の言語をサポートし、128kトークンのコンテキストウィンドウを持っています。このモデルはMistral研究ライセンスの下でリリースされており、研究や非商用目的に限定されていますが、高度なLanguage Modelの進化を示す重要な出来事です。

高品質かつ小規模なモデルの開発競争は重要な傾向であり、より高度なAIシステムをエッジデバイスに展開することを可能にします。Mistral Large 2の実現は、効率的で強力なLanguage Modelの開発における進歩を示す証左です。

EUの規制当局がMetaのマルチモーダルLlamaAIへのアクセスを制限

Metaは、EUでLlama AIモデルのマルチモーダルバージョンをリリースしないことを発表しました。これは、EUの規制上の懸念によるものです。この決定により、EUの企業がLlama 3.1モデルの高度なマルチモーダル機能にアクセスし、活用することができなくなります。

この措置の主な理由は、AIテクノロジーをめぐる「EUの規制環境の予測不可能な性質」です。EUは最近、著作権、透明性、予測警察などのAI用途に関する規則を含む厳しい新しいAI法の遵守期限を確定させました。

この規制環境により、オープンライセンスの下でリリースされているにもかかわらず、MetaはマルチモーダルのLlamaモデルのEU展開を中止することにしました。これは、Apple Intelligenceの機能をEUから除外すると述べたAppleの同様の措置に続くものです。

マルチモーダルLlamaモデルにアクセスできないことは、この技術の高度な機能を活用しようとしていたEUの企業や研究者にとって大きな障害となります。Llama 3.1モデルのマルチモーダル性は、テキスト、画像、その他のモダリティの統合を可能にし、幅広い応用分野を開いていたはずです。

この状況は、イノベーションへの欲求と、AIの開発に伴うリスクや倫理的懸念に対処するための堅牢な規制枠組みの必要性との間の緊張関係を浮き彫りにしています。EUがAIに対する枠組みを確立しようとしていることは理解できますが、最先端技術へのアクセスを阻害してしまう意図せざる結果は、政策立案者が取り組むべき課題です。

グローバルなAI環境が継続的に進化する中で、イノベーションの促進と責任あるAI開発の両立は、規制当局と技術企業双方にとって重要な課題として残り続けるでしょう。

Stable Audio Open - テキストから音声への変換モデル

Stability AIは、オープンソースのテキスト-音声モデル「Stable Audio Open」の研究論文を発表しました。このモデルは、テキストプロンプトから高品質のステレオオーディオを44.1kHzで生成することができ、リアルな音声やフィールドレコーディングの合成に最適です。

このモデルはコンシューマグレードのGPUで動作するため、学術的および芸術的な用途に手頃に利用できます。最大47秒の音声を生成でき、Freesound やFree Music Archiveなどのライセンス付き録音素材を使って学習されています。

ユーザーは6000GPUでローカルにファインチューニングできるほか、雨音や躍動感あるヒップホップのドラムループ、オーディオロゴなど、幅広い音声生成用途をサポートしています。

このStability AIによるリリースは、テキスト-音声変換分野における重要な進展であり、クリエイターや研究者に強力かつアクセシブルなツールを提供するものです。

GPT-4の音声機能が近日公開予定

記事によると、OpenAIはGPT-4の高度な音声機能を、今月末までに選別されたユーザーグループに提供する予定だそうです。著者は、この新しい音声モードを早速試してみたいと考えています。

記事では、OpenAIのCEOであるSam Altmanのツイートを引用しており、Altmanは音声モードの提供時期について、アルファ版が今月中に始まり、一般提供(GA)はそれよりも少し遅れると述べています。

著者は、GPT-4の音声機能のリリースを心待ちにしており、新機能を試して探索したいと考えています。テキストプロンプトから高品質で自然な音声を生成する機能は、AI音声生成分野における重要な進歩と見なされています。

Open AIが財務上の課題に直面

報告によると、OpenAIは深刻な財務上の課題に直面しており、今年5億ドルの損失が見込まれています。同社の支出、特にAzureに40億ドルも費やしていることが、推定300億ドルの収益を上回っているのが原因です。

この財務状況は、OpenAIの持続可能性と、同様の技術を無料で提供するMetaなどとの競争力に懸念を呈しています。OpenAIは依然として主要プレイヤーですが、インテリジェンスとAIが商品化されつつある中で、同社が差別化を図るためには、一般的なモデルに頼るだけでなく、複数のモデルの提供、独自のインファレンス機能、特化したファインチューニングモデルなどを提供する必要があります。

AI市場の競争は激化すると予想され、OpenAIは自社の競争優位性を維持し、長期的な存続を確保する方法を見出す必要があります。

AlphaProof - 数学問題を解くAIシステム

Google DeepMindは、同社のAIシステムAlphaProofが、国際数学オリンピック(IMO)の問題を銀メダルレベルで解決できることを示す新しい論文を発表しました。これは非常に重要な成果です。これらの数学問題は世界で最も難しいとされているためです。

AlphaProofシステムの主な特徴は以下の通りです:

  1. 強化学習ベースのアプローチ: AlphaProofは、形式的な数学推論のための強化学習ベースのシステムを使用しており、未解決の数学問題を解決するための新しいアルゴリズムや洞察を発見することができます。

  2. 幾何学問題解決の向上: このシステムには、以前のAlphaGeometry 2の改良版も含まれており、これとAlphaProofを組み合わせることで、最新のIMO競技の6問題中4問を解決することができました。

  3. 銀メダルレベルの実績: IMO競技の銀メダリストと同等のパフォーマンスを達成したことで、AlphaProofは数学者の仕事を支援できるAIシステムの重要な進歩を示しています。

  4. 推論力と学習データの限界: 著者らは、一般的な数学問題を解決する際の現在のAIシステムの限界、すなわち推論力と学習データの不足を認めています。

この研究は、複雑な数学問題に取り組むAIの能力の向上を示しており、AIが自律的に新しい数学的洞察や手法を発見できる日が近づいていることを示唆しています。著者らが指摘するように、これは「知性の爆発」につながる重要な一歩です。

FAQ