中国が強力な AIモデルを発表、ベンチマークでGPT-4を上回る

中国の新しいAIモデル、Sense Nova 5.0は、主要なベンチマークでGPT-4を上回っているとの報告があり、グローバルなAI競争の激化を示しています。このブログ記事では、このモデルの機能、パフォーマンスの比較、急速に進化するAIの環境への影響について探ります。

2025年2月14日

party-gif

中国の革新的なAIモデルがGPT-4を幅広いベンチマークで凌駕し、AIの地平を揺るがしていることを発見してください。この最先端の技術は、AIの能力の未来を垣間見せる中国のAI分野における台頭を示しています。

Sense Nova 5.0: ベンチマークでGPT-4を上回る

報告によると、中国のAI企業Sense Timeが最近、GPT-4を様々なベンチマークで上回る新しい言語モデル「Sense Nova 5.0」を発表しました:

  • Sense Nova 5.0は100億トークン以上で訓練された複合モデルで、推論時に最大20万トークンをサポートしています。
  • このモデルはこれまで最先端とされていたGPT-4 Turboを超えるパフォーマンスを発揮すると主張されています。
  • ライブデモンストレーションでは、Sense Nova 5.0がクリエイティブライティング、論理推論、図表理解、画像からのカロリー推定などの課題でGPT-4を上回ることが示されました。
  • GPT-4 Turboや、LLaMA 370Bなどの大規模言語モデルとの比較ベンチマークでは、数学のゼロショット課題を除いて、Sense Nova 5.0がほとんどのカテゴリーでGPT-4 Turboを上回っています。
  • 興味深いことに、18億パラメータの小規模モデルのSense Chat Lightも、Google Gemini 2Bやllama 2.7Bなどの同規模モデルを、カスタムベンチマークで上回っているようです。
  • また、報告ではSense Nova 5.0の画像生成性能も高く評価されており、テキストの説明から写実的なポートレートを生成できることが示されています。

全体として、この報告はSense Timeの最新AIモデルが分野で大きな進歩を遂げ、OpenAIやGoogleといった西側のAI大手に挑戦し得る可能性を示唆しています。中国のAI能力の急速な進歩は、この分野における世界的な競争を激化させる可能性があります。

Sense Nova 5.0 vs. GPT-4 Turbo およびその他のモデル

報告によると、中国のSense Timeが最近、GPT-4 Turboをほぼすべてのベンチマークで上回る新しいAIモデル「Sense Nova 5.0」を発表しました。主なポイントは以下の通りです:

  • Sense Nova 5.0は100億トークン以上で訓練された複合モデルで、推論時に最大20万トークンをサポートしています。
  • このモデルはこれまで最先端とされていたGPT-4 Turboを超えるパフォーマンスを発揮すると主張されています。
  • ライブデモンストレーションでは、Sense Nova 5.0がクリエイティブライティング、論理推論、図表理解、画像からのカロリー推定などの課題でGPT-4を上回ることが示されました。
  • ベンチマークではSense Nova 5.0がGPT-4 Turboを、数学のゼロショット課題を除いてほとんどのカテゴリーで上回っています。
  • Llama 370BやClaude Opusといった他の大規模言語モデルと比較しても、一部の分野で優位性を示しています。
  • Sense Timeはまた、18億パラメータの小規模モデルであるSense Chat Lightが、同規模のGoogleやLlamaのモデルを上回る性能を発揮したことも示しています。
  • この発表後、同社の株価は30%以上上昇し、市場がその AI 進歩に期待を寄せていることがうかがえます。

全体として、この報告は中国がAIレースで大きな進歩を遂げ、米国主導のモデルに挑戦し得る可能性を示唆しています。ただし、独立した評価と実世界での検証が必要不可欠です。

Sense Chat Light: より大きなモデルを凌駕するコンパクトなモデル

中国のSense Timeが開発した18億パラメータのモデル「Sense Chat Light」は、Google Gemini 20億やAnthropicのLlama 130億といった大規模モデルを凌駕する性能を示しています。

提示されたベンチマークでは、Sense Chat Lightが包括的スコア、言語理解、創造性、推論の各分野でこれらの大規模モデルを上回っています。これは重要な成果です。通常、モデルサイズが大きいほど性能が良いと考えられてきたからです。

Sense Timeが、比較的小さなパラメータ数でこれほど高い性能を実現できたことは、同社の技術力の高さを示しています。モデルアーキテクチャや訓練手法の革新により、効率的な高性能AIシステムの開発に成功したと考えられます。

ただし、Llama 370億との比較が示されていないのは気になる点です。Sense Chat Lightがこの巨大モデルに対してどのように性能するかは不明です。それでも、提示された結果は Sense Timeの進歩を示しており、現在の最先端に挑戦し得る高性能かつ効率的なAIシステムの開発に成功したことを示唆しています。

Sense Nova 5.0の印象的な画像生成機能

報告によると、Sense Nova 5.0は画像生成の分野でも印象的な能力を発揮しています。このモデルは、微妙な表情や写実的な肖像画の生成において新しい基準を打ち立てたとされています。

報告では、モデルに「活気のある、アジア人女性の肖像画。美しいメイク、カジュアルな髪型、笑顔、映画級の品質。さまざまな表情とスタイルを表現する」と指示したところ、生成された画像が、テキストの説明を巧みに解釈し、微妙な表情や様々なスタイルの写実的で映画級の肖像画を生み出したと述べられています。

Midjourney等のサービスと同等レベルかもしれませんが、Sense Nova 5.0の画像生成能力は非常に写実的で写真のようだと報告されています。これは、このモデルの高度なテキスト-画像生成能力の印象的な実証だと言えます。

結論

中国から新しいAIモデル「Sense Nova 5.0」が登場し、AI コミュニティで大きな関心と議論を呼んでいます。報告によると、このモデルはクリエイティブライティング、論理推論、画像理解などの分野でGPT-4 Turboを凌駕するパフォーマンスを発揮しているようです。

これらの主張は印象的ですが、Sense Nova 5.0の実力を完全に評価するには、独立した検証とテストが必要不可欠です。同社の株価が発表後30%も上昇したことは、市場がこのモデルの可能性に期待を寄せていることを示していますが、ベンチマークの正確性や現実世界での性能を必ずしも意味するものではありません。

この動きは、中国がアメリカと並んで AI 分野での強力な競争相手として台頭してきていることを示しています。各国や企業が AI 研究開発に大規模な投資を行う中で、この分野での進歩と革新が続くことが期待されます。

Sense Nova 5.0が、特にChatbotArenaなどの実用性を評価するベンチマークでどのように性能するかが注目されます。また、18億パラメータの小規模モデルの性能も興味深い点です。

全体として、Sense Nova 5.0の登場は AI 界における重要な出来事であり、このモデルの進化と、各国企業間の競争の行方を注視していく必要があります。

FAQ