人工智慧軍備競賽:探索大型語言模型和人工智慧生成內容的最新進展

探索大型語言模型和 AI 生成內容的最新進展,包括 Gemini 1.5、GPT-4 Turbo 和 Stable LM2、MixtureOfExperts 8X 22B 等開源模型的可用性。了解這些 AI 模型如何改變各行業,以及對初創公司、行銷和內容創作的影響。

2025年2月21日

人工智慧正在快速改變我們創造和消費內容的方式。這篇部落格文章探討了大型語言模型、人工智慧驅動的影片生成以及不斷升級的人工智慧競賽的最新進展,提供了見解,可以幫助企業利用這些技術來提升他們的行銷和上市策略。

大型語言模型的最新進展:Gemini 1.5、GPT-4 Turbo 和開源創新
減少對 Nvidia GPU 的依賴:來自 Google、Intel 和 Meta 的新 AI 晶片
用 AI 革新視頻創作:Image-In 2、Google Vids 和 Magic Time
推動透明化:關於 AI 訓練數據披露的提案法案
擁抱 AI 輔助藝術:卡牌遊戲開發商的 90,000 美元投資
結論

大型語言模型的最新進展:Gemini 1.5、GPT-4 Turbo 和開源創新

本週最重要的消息是關於新的大型語言模型即將推出或已經推出的消息。

Google 宣布 Gemini 1.5 現已在 180 多個國家推出,擁有 100 萬個 token 的上下文窗口 - 相當於約 75 萬個單詞。這個擴大的上下文窗口是對之前模型的重大改進。開發者現在可以通過 API 訪問 Gemini 1.5 來構建應用程序。

作為回應,OpenAI 宣布 GPT-4 Turbo 模型已通過 API 推出,並正在 ChatGPT 中推出。雖然細節有限,但據報告它在編碼和數學方面的表現優於之前的版本。

開源世界也在不斷發展。Stability AI 發布了 Stable LLM2,這是一個 120 億參數的模型。同時,Anthropic 悄悄發布了一個新的 220 億參數的專家混合模型 Mixr 8X 22B,作為種子下載提供。

Google 還宣布了新的開源 Gemma 模型 - 一個針對編碼優化的模型,另一個則是為高效研究而設計的模型。此外,Meta 預計將發布備受期待的 LLaMA 3 模型,據傳它在能力上可與 GPT-4 媲美,但是開源的。

這一系列大型語言模型的發布宣告,無論是閉源還是開源模型,在這個領域都在不斷推動著技術的創新和進步。

減少對 Nvidia GPU 的依賴:來自 Google、Intel 和 Meta 的新 AI 晶片

看來所有主要的科技公司在開發大型語言模型時,都在努力減少對 Nvidia GPU 的依賴。Nvidia 目前主導著 AI 訓練所使用的 GPU 市場,但 Google、Intel 和 Meta 都推出了自己的定制 AI 芯片。

Google 在 Google Cloud Next 活動上推出了 Axion 處理器。Intel 發布了 Gaudi 3 AI 芯片,聲稱其能效比 Nvidia 的 H100 GPU 高 40%。Meta 宣布了第二代 MTI (Meta Training and Inference) 加速器芯片,聲稱其性能比第一代提高了 3 倍。

與此同時,在 Nvidia 今年早些時候舉行的 GTC 活動上,他們宣布了下一代 Nvidia Blackwell 芯片,據稱其性能比當前的 H100 GPU 強大 4 倍。這表明 Nvidia 在 AI 訓練的原始計算能力方面仍然遙遙領先。

儘管 Google、Intel 和 Meta 的這些定制芯片旨在減少對 Nvidia 的依賴,但能否真正趕上 Nvidia 最新的進步仍有待觀察。開發最強大和最高效的 AI 硬件的競賽正在激烈進行。

用 AI 革新視頻創作:Image-In 2、Google Vids 和 Magic Time

在 Google Cloud Next 活動期間,這家科技巨頭推出了幾款令人興奮的 AI 驅動的視頻創作工具,有望改變這個行業。

Image-In 2:Google 的回應是 Dolly 和 Firefly 等工具,Image-In 2 不僅可以生成靜態圖像,還可以生成短動畫 GIF 和短片。這些文本到實時圖像的功能使用戶能夠輕鬆創造出吸引人的循環視覺效果。

Google Vids:被描述為一種「PowerPoint 風格」的視頻生成器,Google Vids 使用 AI 根據腳本或提示創建幻燈片式的視頻。生成的視頻模仿專業演示軟件的美學,使其成為創建精美、AI 驅動視頻內容的有價值工具。

Magic Time:由研究團隊開發的 Magic Time 是一款專門的視頻生成器,專注於創造高質量的縮時攝影視頻。用戶只需提供提示,就可以生成視覺上令人驚嘆的縮時攝影視頻,如植物生長或建築項目。開源代碼和 Hugging Face 演示使 Magic Time 易於實驗和集成到各種視頻工作流程中。

這些 AI 驅動的視頻工具展示了生成能力的快速進步,賦能創作者簡化視頻製作流程,探索新的創意領域。隨著技術的不斷發展,這些 AI 驅動的視頻生成器對內容創作格局的影響勢必重大。

推動透明化:關於 AI 訓練數據披露的提案法案

根據記錄,美國國會已經提出了一項新法案,旨在強迫人工智能公司披露他們用於訓練生成式 AI 模型的受版權保護的材料。關鍵要點如下:

該法案將要求 AI 公司在發布 AI 模型至少 30 天前,提交一份關於他們使用的受版權保護材料的報告。
這被視為提高透明度的舉措,因為一些最大的科技公司,如 Google、Microsoft 和 Meta,可能不願意透露他們用於訓練的數據。
有人擔心這些強大的公司可能會遊說反對該法案,以阻止其通過。
這項提議的立法是在對大型語言模型使用的訓練數據日益審查的背景下提出的,據報告,OpenAI 可能使用了超過 100 萬小時的 YouTube 視頻來訓練 GPT-4。
該法案旨在解決 AI 公司在訓練數據透明度方面的問題,這些數據可能包括來自各種來源的受版權保護的材料。

擁抱 AI 輔助藝術:卡牌遊戲開發商的 90,000 美元投資

一家卡牌遊戲開發商最近大量投資了 AI 輔助藝術,向一位 AI 藝術家支付了 9 萬美元來生成卡牌藝術。雖然「AI 藝術家」這個術語可能存在爭議,但這種方法突出了 AI 在以高效的方式創造高質量內容方面的潛力。

開發商發現,沒有任何人類藝術家能夠與 AI 生成的圖像相媲美。然而,這個過程不僅僅是按下按鈕讓 AI 完成工作。開發商隨後使用 Photoshop 和其他圖像編輯工具對 AI 生成的圖像進行修飾和完善,確保顏色、一致性和整體風格符合所需的美學。

這種方法展示了 AI 輔助藝術的力量,AI 生成初步概念,人類藝術家則對其進行打磨和完善,以達到所需的結果。通過利用 AI,開發商能夠高效地創造大量卡牌圖像,同時仍然保持所需的藝術感和品質控制。

這一成功案例突出了 AI 在創意行業中的日益重要的角色,它可以作為一種強大的工具來增強和提升人類藝術家的工作,而不是完全取代他們。隨著 AI 技術的不斷進步,我們可以期待看到更多這種 AI 輔助藝術的例子,人機協作將產生創新和高質量的創作成果。

結論

大型語言模型和 AI 技術的快速進步確實令人驚嘆。本週見證了一系列令人興奮的消息,從擁有 100 萬個 token 上下文窗口的 Gemini 1.5 的推出,到 GPT-4 Turbo 和開源的 Stable LM2 及 Mixr 8X 22B 模型的發布。

科技巨頭開發自己的 AI 芯片以減少對 NVIDIA 的依賴的競爭,也是一個引人注目的發展,Google、Intel 和 Meta 都推出了新的 AI 專用處理器。使用 AI 生成動畫和視頻,如 Google 的 Image-in-2 和 Magic Time 項目,也是一個重大進步。

這些進步的潛在影響,無論是正面還是負面,都是巨大的。強迫 AI 公司披露訓練數據來源的法案的引入,是解決透明度和問責制問題的重要一步。同時,Adobe 直接從創作者那裡購買視頻內容來訓練其模型的做法,可能成為未來的一種模式。

總的來說,AI 格局正以驚人的速度不斷發展,每週都會出現新的功能和挑戰。作為一個 AI 愛好者,追蹤這些發展並考慮其對企業、創作者和整個社會的道德和實際影響,都是一件令人興奮的事情。

常問問題

什麼是Gemini 1.5?

Gemini 1.5能做什麼?

GPT-4 Turbo的最新版本是什麼?

什麼是Mixr 8X 22B?

什麼是LLaMA 3?

本週宣布了哪些新的AI芯片?

什麼是Image In 2?

什麼是Google Vids?

什麼是Magic Time?

什麼是Humane AI Pin?

什麼是The Next Wave播客?

創造你的人工智慧女友

使用我們的人工智慧女友產生器打造您的理想伴侶