蘋果加入 OpenAI 董事會、OpenAI 遭駭客攻擊、越獄以及更多 AI 新聞

探索最新的人工智慧新聞和發展,包括蘋果公司在OpenAI董事會的席位、設備內人工智慧的進步、新的語音隔離工具,以及圍繞OpenAI內部黑客活動的安全問題。探索人工智慧計算不斷變化的格局及其對媒體和技術未來的影響。

2025年2月24日

這篇部落格文章提供了人工智慧產業最新發展的全面概述,涵蓋了從蘋果公司參與OpenAI到新的人工智慧模型和工具發布等各種主題。讀者將了解到人工智慧技術不斷演進的景觀,包括設備內人工智慧處理、語音功能和3D資產生成方面的進步。此外,該文章還討論了人工智慧社區內重要的安全問題和漏洞,為該領域的現狀提供了全面的視角。

蘋果加入OpenAI董事會:一個令人驚訝的舉動
Salesforce推出Einstein Tiny Giant:設備端AI的崛起
Open Science的Moshi:超越OpenAI的語音能力
計算的未來:範式轉移
11 Labs的創新音頻工具:語音隔離和名人聲音
Perplexity Pro Search:推進多步推理和編碼能力
Meta 3D Gen:改變3D資產創作
GPT-4All 3.0:開源本地LLM桌面應用程式
Anthropic的模型評估計劃:確保安全性和一致性
Skeleton Key AI Jailbreak:繞過安全協議
OpenAI的安全困擾:被駭的消息系統和未加密的聊天記錄
結論

蘋果加入OpenAI董事會:一個令人驚訝的舉動

據報導,蘋果公司正獲得 OpenAI 董事會的觀察員席位。這是一個令人驚訝的舉動,因為微軟必須購買 OpenAI 的一半股權才能獲得董事會席位,而蘋果公司不需要向 OpenAI 支付任何費用就獲得了董事會席位。這個席位已經被選定給蘋果公司前營銷主管 Phil Schiller。

這個消息很有趣,因為在蘋果公司宣布其 AI 計劃後,人們認為他們與 OpenAI 的合作關係會更加密切。大家都認為 ChatGPT 會深度融入蘋果生態系統,但事實證明,蘋果公司已經在內部開發了大量的人工智能技術,用於在其設備和私有雲端上運行。任何需要世界知識的任務都會被卸載並發送到 OpenAI 的 API,但每次都需要確認用戶的意圖。

看來蘋果公司正在獲得雙重利益 - 他們利用 OpenAI 的能力,同時也在內部開發自己的 AI 解決方案。這一舉動表明,蘋果公司正在戰略性地定位自己,在 AI 領域佔據有利地位。

Salesforce推出Einstein Tiny Giant:設備端AI的崛起

銷售力公司(Salesforce)的首席執行官馬克·貝尼奧夫(Mark Benioff)宣布推出 Salesforce Einstein Tiny Giant,這是一個擁有 10 億個參數的模型,在設備內性能方面優於 GPT-3.5 和 Claude 等 7 倍大的模型。這一發展是朝著 AI 處理未來的重要一步,小型高效的模型將在其中扮演關鍵角色。

Salesforce Einstein Tiny Giant 的主要亮點包括:

它是一個擁有 10 億個參數的模型,在大型語言模型世界中屬於「微型」模型。
儘管體積較小,但在設備內性能方面仍優於 GPT-3.5 和 Claude 等更大型的模型。
這個模型代表了設備內 AI 處理的興起,計算在用戶設備上本地進行,而不是依賴於雲端基礎設施。
設備內 AI 處理提供了多項優勢,包括提高隱私性、安全性、低延遲和成本效率。
貝尼奧夫對 AI 技術棧的未來願景是,由一個通用模型協調多個小型、專用的模型,以實現最大的效率和性能。
Salesforce Einstein Tiny Giant 等開源微型模型的出現是實現這一 AI 技術棧未來願景的重要一步。

總的來說,Salesforce Einstein Tiny Giant 的推出證明了設備內 AI 處理的日益重要性,以及小型、更專門的模型在某些用例中可能優於更大型模型的潛力。

Open Science的Moshi:超越OpenAI的語音能力

一家名為 Open Science 的公司似乎已經超越 OpenAI,實現了全面的語音功能。他們發布了 Moshi,這是一個實時的原生多模態基礎模型,可以聽和說,類似於 OpenAI 在 5 月份展示的 GPT-4 的語音功能。然而,GPT-4 的語音功能推遲了,尚不清楚何時會發布。

Moshi 有以下幾個令人印象深刻的功能:

能夠表達和理解情感
說話帶有類似法語的口音
可以聽和生成語音
在說話時進行思考
支持同時聽和說的雙音頻流
在合成數據上進行聯合預訓練,並在 10 萬條口語化合成對話上進行微調
從由單獨的 TTS 模型生成的合成數據中學習了自己的聲音
端到端延遲為 200 毫秒
有一個可以在 MacBook 或消費級 GPU 上運行的較小版本
使用水印技術來檢測 AI 生成的音頻
即將全面開源,包括演示、代碼、模型和論文

雖然作者嘗試過演示,發現它表現不太一致,但他們很期待在開源版本可用時再次測試。擁有一個實時的多模態基礎模型,可以聽和說,這是一個重大進步,很有趣看看 Moshi 的表現如何與 OpenAI 未來的語音功能相比。

計算的未來:範式轉移

根據 OpenAI 的聯合創始人、人工智能領域的著名人物 Andrew Karpathy 的說法,計算的本質正在發生根本性的變化。我們正在進入一個新的計算範式,類似於 1980 年代的計算。

與其中央處理器對指令進行字節運算不同,我們現在有大型語言模型作為中央處理器,對令牌(小字符串片段)進行運算。此外,我們有一個令牌的上下文窗口,而不是字節的 RAM,以及其他計算組件的等價物。

Karpathy 將這種新的「計算機」稱為大型語言模型(LLM),他認為這是一個我們正在學習如何編程的新系統。了解其優勢、局限性以及如何有效地將其納入產品中,在未來幾年至關重要。

這種計算範式的轉變意味著,傳統的操作系統和應用程式可能不再必要。未來可能涉及直接與大型語言模型對話,後者可以在任何終端設備上執行所需的計算,而無需傳統的軟件開發。

Karpathy 認為,這種未來的願景挑戰了開發人員的當前角色,他相信開發人員的需求在未來 10 年內可能會大幅減少。計算格局正在演變,有效利用大型語言模型將是推動創新和進步的關鍵驅動力。

11 Labs的創新音頻工具:語音隔離和名人聲音

11 Labs 這家 AI 語音公司發布了兩款新的令人興奮的產品:

語音隔離器: 這個工具可以錄製語音並從任何音頻樣本中提取清晰的語音,即使存在大量背景噪音。演示展示了它去除背景噪音並提供高品質音頻的能力,這對於在嘈雜環境中錄製採訪或視頻通話非常有用。
名人之聲: 11 Labs 正在將名人之聲引入其 iOS 應用程式,允許用戶讓好萊塢的歷史性偶像,如詹姆斯·迪恩、朱迪·嘉蘭、伯特·雷諾茲和勞倫斯·奧利弗,說出他們想說的話。這個功能展示了媒體的未來,知識產權所有者可以將複製一個人的聲音和形象的權利出售給 AI 公司。

11 Labs 的這些創新音頻工具展示了語音技術的進步,以及 AI 改變各行各業(從內容創作到通信)的潛力。語音隔離功能可以大大提高音頻錄製的質量,而名人之聲功能則開啟了個性化媒體體驗的新可能性。

Perplexity Pro Search:推進多步推理和編碼能力

Perplexity 宣布更新了 Pro Search 版本,可以對更複雜的查詢進行更深入的研究,包括多步驟推理以及高級數學和編程功能。

Perplexity Pro Search 更新的主要功能包括:

多步驟推理: 該系統現在可以以更多步驟的推理方式處理複雜的問題。它理解哪些問題需要規劃,逐步工作,並以更高的效率綜合深入的答案。
Wolfram Alpha 和代碼執行: Perplexity Pro Search 增加了高級數學和編程功能,允許它解決需要代碼執行的複雜問題,例如 100 跳的「夜間撥號」問題。
改進的查詢處理: 更新後的系統可以處理更複雜的查詢,將其分解為多個步驟,以提供全面和經過深思熟慮的答案。

這些增強使 Perplexity Pro Search 成為一個更強大的研究工具,能夠處理需要規劃、推理和整合各種信息源的複雜問題。增加高級數學和編碼功能進一步擴展了該系統的問題解決能力。

雖然作者沒有大量使用 Perplexity,但更新後的功能表明它可能是一個有價值的資源,適用於尋求對複雜查詢進行深入、多方面回答的人。是否使用 Perplexity Pro Search 將取決於個人需求和它相對於其他可用工具的價值。

Meta 3D Gen:改變3D資產創作

科技巨頭 Meta 推出了一個突破性的新系統,稱為 Meta 3D Gen。這個創新的 AI 驅動工具旨在革新 3D 資產的創建方式,提供無縫高效的端到端解決方案。

Meta 3D Gen 是一個綜合的 AI 系統,可以從簡單的文字提示生成高品質的 3D 資產,包括詳細的紋理和材質貼圖。這種卓越的功能使創作者能夠以傳統方法通常需要的時間分之一的速度生產出驚艷的 3D 內容。

該系統的性能令人印象深刻,不僅能夠生成優於現有解決方案的結果,而且操作速度也快 3 到 10 倍。這種顯著的效率和質量提升,是 3D 資產創建行業的一大突破。

通過利用 AI 的力量,Meta 3D Gen 使創作者能夠專注於他們的創意願景,而不必陷入 3D 建模和紋理製作的技術複雜性。這種創作工作流程的轉變,有望開啟新的可能性,並引領 3D 內容創作進入新的時代。

Meta 還通過發表兩篇研究論文來支持這個項目,為更廣泛的社區提供了寶貴的見解和技術細節,供他們探索和建立。

隨著媒體格局的不斷演變,動態生成和按需提供 3D 資產的能力將成為關鍵資產。Meta 3D Gen 的功能與個性化和定制內容的新興趨勢相吻合,在這種趨勢下,視頻遊戲、電影和其他媒體可以實時生成,以滿足個人偏好。

Meta 的這項創新技術是該公司致力於推動 3D 資產創建領域極限的又一證明。有了 Meta 3D Gen,媒體和內容生成的未來正面臨著變革性的轉變。

GPT-4All 3.0:開源本地LLM桌面應用程式

允許您本地運行模型的原始項目叫做 GPT-4All,現在他們發布了 GPT-4All 3.0。去年,Meta AI 的原始 LLaMA 模型被洩露,Nomic AI 的創造者(GPT-4All 的創造者)們設法構建了一個應用程式,您實際上可以在本地運行 LLaMA。

GPT-4All 3.0 是這個開源的本地 LLM 桌面應用程式的最新版本。它現在支持數千個模型和所有主要操作系統,並進行了重大的用戶界面和用戶體驗改進。我已經看過並使用過它,它真的很不錯,乾淨,適合那些不想處理本地運行模型複雜性的人。這是一種在不用擔心技術細節的情況下運行模型的好方法。

這個軟件完全開源,採用 MIT 許可,您今天就可以下載並安裝。它內置了本地文件聊天功能,使其成為一種用戶友好的方式來與大型語言模型進行交互。

Anthropic的模型評估計劃:確保安全性和一致性

人工智能公司 Anthropic(開發了高能力語言模型 Claude 3.5)宣布了一項新的舉措,旨在解決為先進 AI 模型開發高質量、與安全相關的評估的挑戰。對這些評估的需求正在超過供給,Anthropic 正在採取措施來解決這一問題。

這項舉措的關鍵要點如下:

開發有效的評估: Anthropic 認識到為 AI 模型開發強大和全面的評估仍然是一項具有挑戰性的任務。目標是資助第三方組織創建可以有效衡量先進功能和安全性的評估。
解決靜態基準的局限性: 現有

常問問題

蘋果加入OpenAI董事會的意義是什麼?

Salesforce Einstein Tiny Giant是什麼,與其他語言模型有何不同?

Open Science的多模態基礎模型Moshi與OpenAI的GPT-4在語音功能方面有何不同?

Andrew Karpathy對計算的未來和大型語言模型的角色有什麼看法?

更新後的Perplexity Pro Search有哪些新功能和能力?

Meta的新3D生成系統是什麼,與現有解決方案有何不同?

GPT-4-All新版本的主要功能和更新是什麼?

Anthropic的新第三方模型評估計劃是什麼,為什麼很重要?

什麼是'骨鑰'AI越獄技術,哪些模型受到影響?

OpenAI系統發現了哪兩個主要的安全問題?

創造你的人工智慧女友

使用我們的人工智慧女友產生器打造您的理想伴侶