画期的な AI チップ、GPT-4 の音声遅延、Claude 3.5 の優位性、AI 駆動のゲーム

最新のAI技術の進歩を探索しましょう。強力なAIチップ、OpenAIの音声遅延、Claude 3.5の優位性、AIを活用したゲームの革新など、急速に進化するAIの最新動向をキャッチアップしましょう。

2025年2月16日

party-gif

AIテクノロジーの最新の進歩を発見してください。革新的なAIチップ、音声機能、コーディングやビデオゲーム開発におけるAIモデルの優位性など。このブログ記事では、最も重要なAIニュースの包括的な概要を提供し、最新の動向を把握するための洞察を与えます。

GPUを上回るパフォーマンスを発揮する新しいAIチップ

本日最初の話題は、LLaMA 70Bを1秒間に50万トークン以上生成できると主張する新しいAIチップ企業「Etched」についてです。この「Sohu」と呼ばれるチップは、Transformerモデル用の初めての専用ASIC(Application-Specific Integrated Circuit)です。

Sohuは、Nvidia社の次世代Blackwellグラフィックスプロセッサよりも10倍以上高速で安価だと言われています。1台のSohuサーバーでは、LLaMA 70Bを1秒間に50万トークン以上処理できます。これはNvidia H100の20倍、Blaize B2の10倍の性能です。

Sohuの主な利点は、ほとんどの主要なAIプロダクトの基盤となるTransformerモデルに特化していることです。同社は、Transformerモデルがより支配的になるにつれ、Sohuのようなカスタムチップが不可欠になると主張しています。なぜなら、GPUのコンピューティング密度の向上が追いつかないためです。

Etched社は、ハードウェア上でTransformerを最も高速かつ安価に実行できるアーキテクチャが「ハードウェアの宝くじ」に勝つと考えています。彼らは、AIラボがTransformerの最適化に何百万ドルも費やしており、スタートアップがTransformer専用のソフトウェアライブラリを使用しているため、GPUでは「Transformer Killers」に追いつくのが難しいと主張しています。

全体として、Etched社のSohuチップは、AIハードウェアの大きな進歩を示しており、この分野でのGPUの優位性を脅かす可能性があります。

OpenAIの音声機能の遅延

OpenAIは、春のアップデートで以前デモンストレーションされたChatGPTの高度な音声モードのロールアウトを遅らせると発表しました。同社は、モデルの特定のコンテンツの検出と拒否機能の改善、ユーザーエクスペリエンスの向上、そして数百万人のユーザーに対応しつつリアルタイムの応答を維持するためのインフラ整備の必要性を理由に挙げています。

同社は6月下旬にChatGPT Plusユーザーの一部にアルファ版の高度な音声モードの提供を開始し、秋にはすべてのPlus ユーザーに提供することを目指しています。ただし、高い安全性と信頼性の基準を満たすことができるかどうかによって、正確なタイムラインは決まります。

OpenAIはまた、新しいビデオおよび画面共有機能のロールアウトにも取り組んでいます。これらの機能は別途発表される予定です。高度な音声モードは、感情や非言語的なしぐさを理解し、応答できる機能を備え、AIとの自然な会話をより実現に近づけると期待されています。

これらの機能リリースの遅延は残念ですが、OpenAIのWhisperボイスモデルのリリースが長引いたことを反映しています。ただし、同社は、これらの機能を広く利用可能にする前に、高水準の安全性と信頼性を確保することの重要性を強調しています。

Anthropicの Claude 3.5 モデルの優位性

Anthropic社のClaude 3.5モデルが大きな飛躍を遂げ、コーディングのArita hard promptsアリーナで1位を獲得し、全体のリーダーボードでも2位に入りました。新しいSonetモデルはOpusを低コストで上回り、GPT-4やGemini 1.5 Proなどのフロンティアモデルと全般的に競争力を持つようになりました。

以前の動画で、クリエイターはClaude 3.5 Sonetモデルをテストし、これまでテストした中で最高のモデルだと述べています。モデルはクリエイターのテストを完全に圧倒し、より挑戦的なテストの要求を促しました。

Claude 3.5とGPT-4のコーディングタスクの比較では、Claude 3.5がタスク成功率と完全プロジェクト成功率で優れていることが示されました。ただし、GPT-4のビルド成功率がわずかに高い傾向にあります。さらに、Claude 3.5はより冗長的で、長いコードに有利ですが、生成速度を遅くする可能性があります。また、大きなプロンプトに従う信頼性はGPT-4に劣ります。

全体として、コーディングやハードプロンプトのアリーナでのAnthropic社のClaude 3.5モデルの優位性は大きな業績であり、大規模言語モデルとその応用の継続的な進歩を示しています。

AIが生成したビデオゲームのフッテージ

Twitterユーザーのchubbyが紹介した動画は本当に驚くべきものです。この動画は、AIが現実的なビデオゲームのフッテージを生成する驚くべき能力を実証しています。Call of Dutyスタイルのゲームに触発されたようなビジュアルは、驚くほど現実的で、AIが生成したサウンドとビジュアルが見事に融合し、没入感のある体験を生み出しています。

フッテージの品質は印象的ですが、このレベルの現実性をリアルタイムで実現するには、膨大なコンピューティング能力が必要とされます。NvidiaのCEOであるJensenが述べたように、これがビデオゲームの未来であり、業界を新しい高みに押し上げるでしょう。

この動画は、現実と人工的な創造の境界線がますます曖昧になっていく中で、AIによるコンテンツ生成の急速な進歩を示しています。この技術が進化し続けるにつれ、近い将来、さらに印象的で現実的なAI生成のビデオゲーム体験を目にすることができるでしょう。

MetaのAI統合に対するAppleのプライバシーの懸念

Appleは、プライバシーの懸念から、Meta(旧Facebook)のAIモデル(Llama 3モデルなど)をSiriに統合しないことを決めました。これは、AppleがメタとのAIモデル統合について話し合っていたという報道が出た直後のことです。

Appleの決定の主な理由は、Metaのプライバシー慣行に対する懸念です。Appleは長らくMetaのプライバシーアプローチを批判してきており、プライバシー関連の数々の問題に直面してきたMetaとの提携には、評判上のリスクがあると考えているようです。

Appleは自身でAIモデルをホストし、プライバシー面での管理を維持することができたにもかかわらず、統合を見送りました。これは、Appleの懸念が単なる技術的な実装を超えていることを示しています。

この決定は、ユーザープライバシーに対するAppleの強い姿勢と、イノベーションとユーザーデータ保護のバランスを取ることの重要性を強調しています。

FAQ