揭開最新人工智慧新聞的面紗:全面回顧

探索最新的人工智慧新聞和更新,從微軟的 1000 億美元數據中心項目到 OpenAI 的語音模型和 ChatGPT 的訪問。了解人工智慧如何顛覆行業並快速發展。了解這項變革性技術的最新發展。

2025年2月23日

party-gif

探索這篇全面性的部落格文章中最新的人工智慧突破和行業更新。探索快速發展的人工智慧領域,從微軟和OpenAI的雄心勃勃的數據中心項目到OpenAI的開創性語音生成技術。了解塑造人工智慧未來的最新發展動態。

合成語音的挑戰與機遇

開放人工智慧(Open AI)創造了一個語音模型,可以從15秒的樣本生成逼真的聲音。生成的音頻質量很高,甚至超過了Eleven Labs等工具的功能。

雖然這項技術呈現了令人興奮的可能性,但Open AI也承認存在潛在風險。他們不會公開發布這個模型,因為他們希望確保它不會被濫用。

為了應對這些挑戰,Open AI正在鼓勵採取以下措施:

  • 逐步淘汰基於語音的身份驗證作為安全措施
  • 探索保護個人聲音使用的政策
  • 教育公眾關於AI生成內容可能存在欺騙性的可能性
  • 加快開發和採用用於追蹤視聽內容來源的技術

通過採取負責任的方式,Open AI旨在應對合成聲音的複雜性,並確保這項技術以有益於社會的方式使用,同時減輕潛在危害。

Dolly 3中的修復

Open AI已經為他們的圖像生成模型Dolly 3添加了一個新的inpainting功能。這允許用戶選擇生成圖像的某個區域,並提示模型對該特定區域進行更改。

例如,如果您使用Dolly生成了一個圖像,但對某些元素(如懸浮滑板上的輪子)不滿意,您可以突出顯示這些區域,並提示模型"移除輪子"。Dolly將重新生成該圖像的部分,試圖按要求移除輪子。

這種inpainting功能為使用者在使用Dolly生成的圖像時提供了更多的控制和靈活性。它允許進行迭代的細化和編輯,而不必從頭開始。然而,該功能可能仍需要嘗試幾次才能獲得理想的結果,因為模型並不總是完美地執行所請求的更改。

總的來說,添加inpainting是Dolly 3的一個有用的增強功能,賦予用戶更多微調和自定義生成圖像的能力。

Stable Audio 2.0中的音頻到音頻生成

本週,Stability AI宣布推出Stable Audio 2.0,其中包括一項名為音頻到音頻生成的新功能。通過此功能,您可以用嘴哼唱或發出樂器聲音,AI將嘗試複製這些聲音並生成音頻。

這是一個例子:

[音樂]

雖然這個功能很有趣,但生成的音樂質量和激情水平還無法與Jukebox等工具相媲美。Stable Audio 2.0生成的歌曲仍然相當基本,缺乏人類創作音樂的複雜性和豐富性。

總的來說,Stable Audio 2.0中的音頻到音頻生成是一個進步,但在真正與專業音樂製作競爭之前,它仍有待改進。

音樂家反對不負責任的AI的信

包括Nicki Minaj、Billy Eilish和Katy Perry在內的一群音樂人簽署了一封反對在音樂行業中不負責任使用AI的信。信中的關鍵要點如下:

  • 簽署者呼籲AI開發者、科技公司、平台和數字音樂服務停止使用侵犯和貶低人類藝術家權利的AI。

  • 然而,信中承認,當以負責任的方式使用時,AI有巨大的潛力來推進人類創造力,並為音樂粉絲創造新的令人興奮的體驗。

  • 信中表達了對"掠奪性使用AI來竊取專業藝術家的聲音和肖像,侵犯創作者權利,破壞音樂生態系統"的擔憂。

  • 簽署者表示,"對人類創造力的攻擊必須停止",他們必須保護免受可能危害藝術家和音樂行業的AI濫用。

  • 總的來說,這封信採取了謹慎的立場,認識到AI在音樂中的潛在利弊,並呼籲以負責任的方式開發和使用這項技術,以保護人類藝術家的權利和生計。

Crea AI的新圖像混合功能

Crea AI,這款基於AI的圖像生成工具,最近推出了一項新的"圖像混合"功能。這個功能允許用戶上傳多個圖像,調整每個圖像的權重,並實時查看結果圖像的混合效果。

例如,Crea AI團隊演示了這個功能,上傳了三張圖像,提示是"用瓷器做成的魚"。當他們調整各個圖像的權重時,輸出圖像動態地將來自不同源圖像的元素融合在一起。

這項新功能非常令人印象深刻,因為它使用戶能夠無縫地將各種視覺元素結合成一個統一的圖像。實時混合允許快速實驗和細化,使Crea AI成為一個更強大的創意表達和構思工具。

混合多個圖像的能力為Crea AI用戶開闢了新的可能性,使他們能夠創造出更複雜和細緻的視覺構圖。這一功能進一步展示了AI驅動圖像生成技術的持續進步,推動了這項技術的可能性。

AI對工作和ICT勞動力的影響

AI技術的快速進步引發了對就業影響的擔憂。現在,許多大型科技公司正聚在一起通過ICT Workforce Consortium來解決這個問題。

這個聯盟包括思科、谷歌、微軟和IBM等公司,旨在找到方法,防止人們因AI的興起而失去工作。目標是在AI持續發展並可能自動化某些任務的情況下,找出如何保持人們就業。

這是一個重要的舉措,因為有報告稱,像谷歌這樣的大型科技公司裁員數千人,有些人猜測AI是一個促成因素。然而,事實是這些裁員更多是因為公司重組,以更多地關注AI開發,而不是AI直接取代人類工人。

儘管如此,AI對傳統工作角色的破壞潛力是真實的,ICT Workforce Consortium是一個積極的步驟,旨在解決這一挑戰。通過匯集行業領導者,該聯盟旨在制定策略和解決方案,幫助工人適應不斷變化的就業環境,並確保AI的利益得到廣泛分享,而不是集中在少數科技巨頭手中。

隨著AI的不斷進步,公司、政策制定者和工人合作尋找利用這項技術的同時保護就業和生計的方法將是至關重要的。ICT Workforce Consortium代表了朝這個方向邁出的重要一步。

在法庭上使用AI增強的視頻證據

華盛頓的一家法院禁止使用AI增強的視頻證據。問題在於,基於AI的放大工具(如Topaz Labs)實際上並不能提高視頻畫質。相反,AI試圖猜測中間的像素,可能添加或改變原始畫面中不存在的細節。這引發了對證據可靠性和真實性的問題,使其不適合用於法庭程序。這一裁決突出了在使用AI增強的媒體時需要謹慎,因為這項技術可能會無意中引入不準確或失真,從而損害證據的完整性。

在Apple Vision Pro中與他人互動

Apple Vision Pro現在允許用戶在虛擬環境中與他人互動。一些主要功能包括:

  • 虛擬演示:用戶可以以一個漂浮的無形頭部和雙手的形式出現,在虛擬空間中展示內容並與他人協作。

  • 虛擬遊戲:用戶可以玩虛擬棋盤遊戲、國際象棋和其他互動體驗,與遠程參與者一起玩。這允許在頭戴設備中共享遊戲體驗。

  • 一起觀看電影:用戶可以一起觀看電影或其他內容,每個參與者在共享環境中都以虛擬存在的形式出現。

在Apple Vision Pro中與他人互動的能力代表了一個重要的進步,使其成為一個更加社交和協作的平台,超越了以前虛擬現實設備的孤立體驗。這些新功能使用戶能夠與朋友、同事和其他人在共享的虛擬體驗中互動。

第一款完全自主的電動滑板車和自動駕駛的Uber Eats送貨

一家位於印度的公司創造了一款名為Ola Solo的電動滑板車,聲稱這是第一款完全自主的電動滑板車。其想法是,您可以跳上這款電動滑板車,它會將您送到目的地,無需駕駛員。雖然這是一個有趣的概念,但作者不確定是否會感到舒適地騎乘這種自主滑板車,至少不會是第一版。這將是一件值得關注的事情,看看它是否最終會實現。

此外,在鳳凰城,Wejo車輛現在正在為Uber Eats配送。Wejo是一家自動駕駛汽車公司,其想法是,您可以下訂Uber Eats訂單,一輛自動駕駛汽車會從餐廳取餐並送到您家。您甚至可以在結帳時選擇使用人工配送司機。這是自動駕駛技術的另一個有趣應用。

AI作為Netflix的The Circle的演員

Netflix真人秀節目"The Circle"第6季即將推出,其中將有一個AI貓魚作為參賽者之一。在這個約會風格的節目中,參與者通過社交媒體平台進行交流,而不會面對面見面。有些參賽者甚至創造了假身份,即所謂的"貓魚",試圖贏得遊戲。

這次,一個AI機器人將是這些貓魚角色之一,假扮名為"Max"的人類。看其他參賽者如何與這個AI驅動的參與者互動和反應將是非常有趣的。他們能否發現"Max"並非真人?如果發現了,他們是否仍會試圖與AI建立聯繫?

這個實驗將提供有趣的見解,了解人們如何在社交環境中感知和參與AI。看這個AI是否能成功導航該節目的社交動態,甚至與人類參賽者建立關係,這將是令人興奮的。這個AI的表現結果可能會對AI未來融入我們的社交生活產生更廣泛的影響。

常問問題