Appleがオープンエーアイ理事会に参加、オープンエーアイのハック、ジェイルブレイク、その他のAIニュース

最新のAIニュースと開発を発見してください。これには、OpenAIの取締役会にAppleが座っていること、デバイス上のAIの進歩、新しい音声分離ツール、OpenAIの内部ハッキングに関する安全上の懸念が含まれます。AIコンピューティングの変化する景観と、メディアおよび技術の未来への影響を探ってください。

2025年4月6日

このブログ記事では、AppleのOpenAIへの関与から新しいAIモデルやツールのリリースまで、AIインダストリーの最新の動向を包括的に概説しています。読者は、デバイス上でのAI処理、音声機能、3Dアセット生成などの分野における技術の進歩について洞察を得ることができます。さらに、AIコミュニティ内の重要なセキュリティ上の懸念と侵害についても取り上げており、この分野の現状に関する総合的な視点を提供しています。

アップルがOpenAIボードに参加: 驚くべき動き
セールスフォースがEinstein Tiny Giantを発表: デバイス上のAIの台頭
Open ScienceのMoshi: OpenAIを音声機能で上回る
計算の未来: パラダイムシフト
11 Labsの革新的なオーディオツール: 音声分離と有名な声
Perplexity Proサーチ: マルチステップ推論とコーディング機能の向上
Meta 3D Gen: 3Dアセット作成の変革
GPT-4All 3.0: オープンソースのローカルLLMデスクトップアプリ
Anthropicのモデル評価イニシアチブ: 安全性と一貫性の確保
Skeleton Key AIジェイルブレイク: 安全プロトコルのバイパス
OpenAIのセキュリティ問題: ハッキングされたメッセージシステムと暗号化されていないチャットログ
結論

アップルがOpenAIボードに参加: 驚くべき動き

アップルがOpenAIの取締役会にオブザーバーとして参加することが報告されています。これは驚くべき動きです。マイクロソフトはOpenAIの取締役会に座るために半分を買い取る必要がありましたが、アップルはOpenAIに何も支払わずに取締役会の座を得ています。この座はアップルの元マーケティング責任者であるPhil Schillerが選ばれています。

このニュースは興味深いです。アップルのAI発表後、彼らはOpenAIとのパートナーシップを遠ざけていたことが明らかになっていました。誰もがChatGPTがアップルのエコシステムに深く統合されると思っていましたが、実際にはアップルは自社のデバイスや非公開クラウドで動作する独自の人工知能を多く開発してきたようです。世界知識を必要とするタスクはOpenAIのAPIに委託されますが、ユーザーの意図を毎回確認してから行われます。

アップルは両者の良いところを手に入れているようです。OpenAIの機能を活用しつつ、自社内でもAIソリューションを開発しています。この動きはアップルが誰もを出し抜いて、AIの分野で戦略的に自身の地位を築いていることを示唆しています。

セールスフォースがEinstein Tiny Giantを発表: デバイス上のAIの台頭

セールスフォースのCEOであるMark Benioffは、GPT-3.5やCloudeを含む7倍大きなモデルを凌駕するパラメータ10億の「Salesforce Einstein Tiny Giant」の発表を行いました。これは、より小さく効率的なモデルが重要な役割を果たす未来のAI処理に向けた重要な一歩です。

Salesforce Einstein Tiny Giantの主な特徴は以下の通りです。

パラメータ10億の「マイクロ」モデルです。
大型モデルよりもデバイス上での性能が優れています。
デバイス上でのAI処理の台頭を示しています。クラウドインフラに依存せずにローカルで処理が行えます。
デバイス上でのAI処理には、プライバシーの向上、セキュリティの強化、低遅延、コスト効率などの利点があります。
Benioffのビジョンでは、特定のタスクに特化した小さなモデルが一般化モデルによって調整される形が未来のAIスタックです。
Salesforce Einstein Tiny Giantのようなオープンソースのマイクロモデルの登場は、この未来のAIスタックの実現に向けた重要な一歩です。

全体として、Salesforce Einstein Tiny Giantの登場は、デバイス上でのAI処理の重要性の高まりと、特定用途に特化した小さなモデルが大型モデルを凌駕する可能性を示しています。

Open ScienceのMoshi: OpenAIを音声機能で上回る

Open Scienceという企業が、OpenAIに先駆けて完全な音声機能を実現したようです。彼らはMoshiという、リアルタイムで音声入出力が可能な多モーダルなファウンデーションモデルをリリースしました。これは、OpenAIがGPT-4で示した機能と似ています。ただし、GPT-4の音声機能はまだリリースが遅れています。

Moshiには以下のような優れた機能があります。

感情を表現し理解する
フランス語のようなアクセントで話す
音声を聞いて生成する
話しながら考える
同時に2つの音声ストリームを処理できる
合成データでの事前学習とTTSで変換された10万件の会話データでのファインチューニング
別のTTSモデルから音声を学習
200ミリ秒のエンドツーエンドの遅延
MacBookやコンシューマー向けGPUで動作する小型版
AIジェネレーテッドオーディオを検出するウォーターマーキング
デモ、コード、モデル、論文を含むオープンソース化予定

著者はデモを試してみましたが一貫性がないと感じています。オープンソース版が利用可能になったら再度試してみたいと思っています。リアルタイムで音声入出力が可能な多モーダルなファウンデーションモデルの登場は大きな進歩であり、MoshiのパフォーマンスがOpenAIの今後の音声機能とどのように比較されるか興味深いです。

計算の未来: パラダイムシフト

OpenAIの共同創設者であるAndrew Karpathyによると、計算の本質が根本的に変化しつつあります。1980年代のコンピューティングに似た新しいパラダイムに入っているのです。

バイトを処理する中央処理装置ではなく、トークン(小さな文字列)を処理する大規模言語モデルが中央処理装置の役割を果たすようになっています。さらに、バイトのRAMではなくトークンのコンテキストウィンドウ、そして他のコンピューティングコンポーネントの相当物があります。

Karpathyはこの新しい「コンピューター」を大規模言語モデル(LLM)と呼び、これが私たちが学習しなければならない新しいシステムだと考えています。その長所、短所、製品への効果的な組み込み方を理解することが今後数年間で重要になります。

このコンピューティングパラダイムの移行により、従来のオペレーティングシステムやアプリケーションが不要になる可能性があります。未来は大規模言語モデルに直接話しかけ、それがあらゆるエンドデバイスで所望の計算を行うというものかもしれません。

このビジョンは開発者の現在の役割に挑戦するものです。Karpathyは10年以内に開発者の需要が大幅に減少すると考えています。コンピューティングの景観は進化しており、大規模言語モデルを効果的に活用する能力が、今後の革新と進歩の鍵となるでしょう。

11 Labsの革新的なオーディオツール: 音声分離と有名な声

AI音声企業の11 Labsが2つの新しい製品をリリースしました。

Voice Isolator: 大きな背景ノイズがある中でも、音声を録音し、クリアな音声を抽出できるツールです。デモでは、背景ノイズを除去し高品質な音声を提供する能力が示されており、ノイズの多い環境でのインタビューや動画通話の録音に役立つでしょう。
Famous Voices: 11 LabsのiOSアプリに有名な声を追加し、ユーザーがジェームズ・ディーン、ジュディ・ガーランド、バート・レイノルズ、ローレンス・オリヴィエといった歴史的なハリウッドのアイコンの声で発言できるようになります。このような機能は、知的財産権所有者がAI企業に人物の声やそっくりさんの権利を販売できる、メディアの未来を示しています。

11 Labsのこれらの革新的なオーディオツールは、音声技術の進歩と、AIがコンテンツ制作やコミュニケーションなどさまざまな業界を変革する可能性を示しています。音声分離機能は録音の品質を大幅に向上させ、有名な声の機能は個別のメディア体験の新しい可能性を開きます。

Perplexity Proサーチ: マルチステップ推論とコーディング機能の向上

Perplexityは、Pro Searchの更新版を発表しました。これにより、複雑なクエリに対する多段階の推論、高度な数学およびプログラミング機能が可能になりました。

Perplexity Pro Searchの主な機能は以下の通りです。

多段階の推論: 複雑な問題に対して、より多段階の推論アプローチを取るようになりました。計画が必要な質問を理解し、目標を段階的に進め、より効率的に詳細な回答を合成します。
Wolfram Alphaとコード実行: Perplexity Pro Searchに高度な数学およびプログラミング機能が追加されました。100ホップの「ナイトダイアル」問題のようなコード実行を必要とする複雑な問題を解決できます。
クエリ処理の改善: 更新されたシステムは、より複雑なクエリを処理し、複数のステップに分解して包括的で論理的な回答を提供できるようになりました。

これらの機能強化により、Perplexity Pro Searchはより強力な研究ツールになりました。計画、推論、さまざまな情報源の統合が必要な複雑な質問に取り組むことができます。数学およびコーディング機能の追加により、問題解決能力がさらに拡張されています。

著者はPerplexityをあまり使っていませんが、更新された機能は、複雑なクエリに対する詳細で多面的な回答を求める人にとって価値のあるリソースになる可能性を示しています。Perplexity Pro Searchを使うかどうかは、個人のニーズと他のツールとの比較によって判断する必要があります。

Meta 3D Gen: 3Dアセット作成の変革

テック大手のMetaが、Meta 3D Genという革新的なシステムを発表しました。このAIベースのツールは、3Dアセットの制作方法を一変させる、シームレスで効率的なエンドツーエンドソリューションです。

Meta 3D Genは、詳細なテクスチャやマテリアルマップを含む高品質の3Dアセットを、単純なテキストプロンプトから生成できる統合AIシステムです。この驚くべき機能により、従来の方法と比べて驚くべき速度で、驚くべき品質の3Dコンテンツを制作できるようになります。

このシステムのパフォーマンスは本当に印象的で、既存のソリューションを凌駕しながら、3倍から10倍の速度で動作します。この大幅な効率性と品質の向上は、3Dアセット制作業界にとってゲームチェンジャーとなるでしょう。

AIの力を活用することで、Meta 3D Genは制作者が技術的な複雑さに煩わされることなく、自身のクリエイティブビジョンに集中できるようにします。このクリエイティブワークフローの変化は、新しい可能性を開き、3Dコンテンツ制作の新時代を切り開く可能性があります。

Metaはさらに、Meta 3D Genに関する2つの研究論文を公開し、より広範なコミュニティがこの取り組みを探索し、発展させられるよう支援しています。

メディアの景観が進化し続ける中で、3Dアセットを動的かつオンデマンドで生成する能力は不可欠な資産となるでしょう。Meta 3D Genの機能は、ビデオゲーム、映画、その他のメディアがユーザーの好みに合わせてリアルタイムで生成される、パーソナライズされたコンテンツの傾向に合致しています。

Metaからのこの革新的な技術は、3Dアセット制作の可能性を押し広げようとする同社の取り組みを示しています。Meta 3D Genにより、メディアおよびコンテンツ制作の未来が変革されることでしょう。

GPT-4All 3.0: オープンソースのローカルLLMデスクトップアプリ

ローカルでモデルを実行できるようにした元のプロジェクトはGPT-4Allで、今回GPT-4All 3.0がリリースされました。昨年、Meta AIのオリジナルのLLaMAモデルがリークされ、GPT-4Allの作成者であるNomic AIの素晴らしい人々が、LLaMAをローカルで実行できるアプリケーションを構築できました。

GPT-4All 3.0は、このオープンソースのローカルLLMデスクトップアプリの最新バージョンです。数千のモデルとすべての主要なオペレーティングシステムをサポートし、UIとUXの大幅な改善が行われています。使ってみましたが、とてもきれいで、ローカルでモデルを実行する複雑さを気にしたくない人向けに作られています。これは技術的な詳細を気にせずにモデルを実行できる良い方法です。

このソフトウェアは完全にオープンソースでMITライセンスされており、今すぐダウンロードしてインストールできます。ローカルファイルチャットが組み込まれており、ユーザーフレンドリーな方法で自分のデバイス上の大規模言語モデルと対話できます。

Anthropicのモデル評価イニシアチブ: 安全性と一貫性の確保

高い能力を持つ言語モデルのClaudeを開発したAnthropic

FAQ

Appleがオープンエーアイの取締役会に参加することの意義は何ですか?

Salesforce Einstein Tiny Giantとは何で、他の言語モデルとどのように比較されますか?

Open Scienceのマルチモーダル基盤モデルMoshiは、音声機能の面でOpenAIのGPT-4とどのように比較されますか?

Andrew Karpathyは、コンピューティングの未来と大規模言語モデルの役割についてどのように考えていますか?

更新されたPerplexity Pro Searchの新機能と機能は何ですか?

Metaの新しい3D生成システムとは何で、既存のソリューションとどのように比較されますか?

GPT-4-All 3.0の主な機能と更新点は何ですか?

Anthropicの第三者モデル評価のための新しい取り組みとは何で、なぜ重要ですか?

'スケルトンキー'AIジェイルブレイク手法とは何で、どのモデルに影響を与えますか?

OpenAIのシステムで発見された2つの主要なセキュリティ問題は何ですか?

AIガールフレンドを作成する

私たちのAIガールフレンドビルダーを使って理想のパートナーを作りましょう