AI 革命:GPT4 Mini、吸血鬼無人機、LLaMA 400B 和提示越獄

探索最新的人工智能突破:LLaMA 400B、肌肉骨骼機器人、Sora AI 生成的影片、以 AI 為先的遊戲引擎,以及更多。了解提示破解技術以及被盜用的 YouTube 數據對 AI 模型的影響。保持領先於人工智能革命的步伐。

2025年2月19日

party-gif

探索人工智慧領域的最新進展,從發布龐大的 LLaMA 400b 模型到開發擁有人類般手掌的機器人。了解最新突破及其對我們未來的潛在影響。

LLaMA 400B 的到來:推動開源 AI 的界限

開源 LLaMA 模型的最大版本 LLaMA 3 400B 即將發布,這在人工智能界引起了熱烈討論。這個擁有 4000 億參數的模型有望將開源人工智能的能力提升到與 GPT-4 等前沿模型相當的水平。

Meta 大量投資這些大規模模型並免費發布的做法,為開源社區帶來了變革性的影響。據報導,400B 版本在 MLU 基準測試上與 GPT-4 接近持平,展示了開源人工智能的驚人進步。

社區期待有機會對這個模型進行全面測試,探索其能力。憑藉其巨大規模和潛力,LLaMA 400B 代表了民主化獲取最先進人工智能技術的重要一步。

克隆的機器人演示令人驚嘆:擁有人類般的靈巧和能力

機器人公司 Clone 展示了他們的「肌肉骨骼超級智能機器人」的令人驚嘆的演示。視頻展示了他們機器人創造物的極其逼真的人類般運動和靈活性。

這些機器人展現了栩栩如生的手部和手臂動作,包括旋轉和屈伸,這是模仿人類手臂和手部複雜動作的能力。這些功能使機器人能夠執行精細的任務,如握持手術刀、注射器、鑽頭和剪刀,展示了它們成為「終極工具使用者」的潛力。

機器人流暢協調的動作既令人印象深刻,又令人不安,因為它們暗示了機器人技術的快速進步,以及這些技術可能接近複製人類能力的可能性。這一演示引發了關於這種先進機器人系統未來應用的問題,包括機器人自主執行手術的可能性。

總的來說,Clone 的展示突出了機器人領域的卓越進步,模糊了人與機器之間的界限,暗示了這些技術未來可能產生的變革性影響。

DALL-E 預覽:探索 AI 生成圖像的能力

OpenAI 發布了全新的 DALL-E 視頻,展示了這個基於人工智能的圖像生成系統的能力。這些預覽展示了各種各樣的人工智能生成圖像,從奇幻場景到逼真的描繪。

Ben Desai 的一段視頻採用黑白美學,展示了一隻巨大的鳥類、一種已滅絕的鳥類生物和一個人騎恐龍穿過城市街道。這些圖像具有超現實和夢幻般的特質,將熟悉的事物與奇幻的元素融合在一起。

Charlotte Tribus 的另一段視頻呈現了看似火烈鳥般的生物站在水中,它們的動作和形狀略有偏離現實。這些抽象、近乎雕塑般的形式展示了 DALL-E 生成獨特和富有想像力視覺效果的能力。

其中一段視頻展示的流體動力學尤其令人印象深刻,一個人似乎在雲朵上滑板,一輛車輕鬆地漂浮著。這些場景中紋理、光線和整體一致性的細節,都證明了人工智能生成圖像技術的進步。

儘管一些人物形象和手部動作可能看起來有些僵硬或不自然,但 DALL-E 預覽的整體質量和創造力無疑令人著迷。隨著技術的不斷進步,人工智能生成的藝術和視覺效果有望進一步推動人類想像力的界限,這令人非常興奮。

AI 驅動的電子遊戲創作崛起:Buildbox 4

Twitter 上的 Chubby 發布了更多 AI 生成的電子遊戲示例,展示了人工智能在遊戲開發領域的驚人潛力。其中一個突出的工具是 Buildbox 4,這是一個以人工智能為先導的遊戲引擎,允許用戶只需提供文字提示就可以創造遊戲。

使用 Buildbox 4,任何人都可以即時生成一個完全可玩的電子遊戲,並可以自定義各種元素,如添加霧效、創造太空射擊遊戲或加入岩石。這種革命性的遊戲創作方式民主化了這一過程,讓個人無需深入的編程知識就能實現自己的創意。

將人工智能技術整合到像 Buildbox 4 這樣的遊戲開發引擎中,代表了這個行業的重大轉變。通過利用人工智能的力量,用戶現在可以快速原型化和迭代遊戲概念,為創造力和實驗開闢了新的道路。這種以人工智能為驅動的方法有望徹底改變電子遊戲的構思、開發和交付方式。

隨著遊戲未來的不斷發展,像 Buildbox 4 這樣的人工智能驅動工具無疑將在塑造這個行業中扮演關鍵角色。按需生成個性化遊戲體驗的能力充滿希望,為人工智能驅動的電子遊戲創作開啟了新的紀元。

Mistol 的 AI 模型發布:Maol、Codstrol Mamba 和 Nemo

Mistol 本週發布了多個新的人工智能模型:

  1. Maol:一個在數學方面特別擅長的模型。Maol 7B 這個小型模型在數學任務上表現非常出色,擁有 32k 的上下文窗口,並以 Apache 2.0 許可證開源。

  2. Codstrol Mamba:一種全新的架構,不是轉換器模型。Mamba 模型具有線性時間推理的優勢,理論上可以無限長地建模序列。Codstrol Mamba 的表現優於其他公司同等規模的模型,並與 Codstrol 22B 相當,但體積更小。

  3. Mistol Nemo:與 Nvidia 合作的產品,基於他們最近發布的 Nron 模型。Mistol Nemo 是一個非常小但功能強大的 120 億參數模型,擁有 128k 的上下文長度。它在各方面都優於 Llama 38B 和 Gemma 29B,同時也是一個多語言模型,在多語言使用案例中遠超 Llama 3。

Mistol 的這三個模型發布展示了開源人工智能領域的快速進步。像 Maol 和 Codstrol Mamba 這樣更小、更高效的模型,以及 Nemo 這樣的最先進模型,都體現了 Mistol 致力於推進人工智能領域,並使強大的模型能夠為更廣泛的社區所用。

使用被盜 YouTube 數據進行 AI 訓練的爭議

最近曝光的蘋果、Nvidia 和 Anthropic 等科技公司使用未經授權的 YouTube 視頻來訓練其人工智能模型的做法,引發了巨大爭議。

這個問題源於一家名為 Anthropic 的公司,它創建了一個名為「The Pile」的開源數據集,用於訓練大型語言模型。Anthropic 在未經許可的情況下,擷取了超過 10 萬個 YouTube 視頻的字幕,並將其納入該數據集。

因此,MKBHD、Mr. Beast、PewDiePie 和 Jack Septic Eye 等知名 YouTuber 受到了影響,因為他們的內容被用於訓練這些人工智能模型,卻未經他們的同意。這無疑激怒了許多內容創作者,他們感覺自己的知識產權遭到了剝削。

這種情況突出了圍繞數據所有權和人工智能訓練倫理的持續挑戰。隨著人工智能公司繼續爭相獲取數據來訓練他們的模型,公平使用和明確盜用之間的界限仍然模糊不清。這個案例可作為一個警示,強調人工智能行業在數據來源和使用方面需要更大的透明度和問責制。

Anthropic 的 Claude AI 現已在 Android 上提供

就在大約一週前,我提到 Claude 最大的問題之一就是沒有 Android 應用程式。然而,似乎 Anthropic 已經聽取了反饋,因為他們現在已經發布了 Claude AI 的 Android 應用程式。

我已經下載了這個應用程式,並可以確認它非常出色。如果你是 Anthropic 的訂閱者,現在你就可以在 Android 設備上使用他們的模型了。目前最好的可用模型是 Claude 3.5 Sonet,據稱它優於 GPT-4。

Android 應用程式的發布是一個重大進展,因為它使用戶能夠直接從移動設備上訪問 Anthropic 強大的人工智能功能。這種可訪問性對於那些需要快速訪問 AI 助手來進行研究、寫作或問題解決等任務的人來說特別有用。

總的來說,Claude AI 在 Android 上的可用性是一個受歡迎的補充,也是使 Anthropic 的技術更廣泛地被接受的一步。

Eureka Labs: Karpathy 的 AI 教育事業

Andre Karpathy,一位人工智能領域的領軍人物,宣布了他新成立的人工智能教育公司 Eureka Labs。Karpathy 曾在特斯拉和 OpenAI 等頂尖人工智能公司工作,現在旨在創造一種新型的教育體驗,利用人工智能的力量。

Eureka Labs 的核心理念是為學習者提供對應的主題專家指導,就像個人導師一樣。然而,Karpathy 意識到這種專家的稀缺,以及將這種方法擴展到全球受眾的挑戰。

為了解決這個問題,Eureka Labs 將利用人工智能技術,特別是大型語言模型,創造一種「人工智能原生」的學習體驗。該公司的首款產品「LLM 101n」將是一門大學水平的課程,指導學生訓練自己的人工智能模型,類似於一個較小版本的 AI 教學助手。

通過利用人工智能的力量,Eureka Labs 旨在提供高質量、個性化的學習體驗,並使之可以被廣大學習者所獲得。Karpathy 的願景是創造一種「學習新事物的理想體驗」,讓學生能夠與主題專家密切合作,即使這些專家在物理上不在場。

這種創新的人工智能教育方法與日益增長的對可訪問和有效學習機會的需求相一致,特別是在快速發展的人工智能領域。Eureka Labs 旨在民主化人工智能知識,賦能全球學習者的使命,是邁向未來的一個有希望的一步,在這個未來,人工智能驅動的教育可以改變我們獲取新技能和知識的方式。

Grock 的 LLaMA 3 工具使用模型:推理速度驚人

Grock 宣布了兩個新的 LLaMA 3 模型,專注於工具使用能力:

  • LLaMA 3 Grock Tool Use 8B
  • LLaMA 3 Grock Tool Use 70B

這些模型已經在合成數據上進行了微調,以在工具使用任務上表現出色,旨在為 AI 代理和應用程式提供動力。

這些模型的關鍵亮點包括:

  • 推理速度極快:8B 模型可以達到每秒超過 4,000 個令牌,而 70B 模型的速度為每秒 330 個令牌。這使它們在實時應用程式中非常高效。
  • 出色的工具使用性能:這些模型在 Berkeley Function Calling 排行榜上展現了強大的性能,這是評估工具使用能力的基準。
  • 嚴格的去污染:團隊使用了強大的去污染技術,確保模型不會過度擬合合成訓練數據。

Grock 的這些 LLaMA 3 工具使用模型代表了 AI 代理與工具互動能力領域的重大進步。高性能和閃電般的推理速度的結合,使它們成為開發 AI 驅動應用程式的理想選擇。

無人機在電力線上充電:一項引人注目的突破

無人機最大的挑戰之一一直是電池續航時間有限,需要頻繁充電。然而,丹麥南方大學的科學家最近取得的一項突破,有望徹底改變無人機技術。

研究人員開發了一種可以自主降落在電線上並使用感應充電的無人機。這架無人機配備了一個「被動驅動的電線抓握器」,可以引導無人機靠近電線並連接,從而開始充電。

常問問題