AI 生成影片超越空?最新發展探討
探索最新的 AI 视频生成工具,如 Cling、Toncraftey、Domo AI 和 Stable Audio,以及 Nvidia、AMD、Intel、Qualcomm 和 Cisco 在推进 AI 功能方面的公告。在特里贝卡电影节和微软的 AI 驱动游戏助手中发现 AI 生成的短片。
2025年2月14日

探索最新的 AI 影片生成、動畫和音效技術,這些技術正在推動著可能性的邊界。探索來自領先科技公司的令人興奮的發展,以及這些工具如何革新內容創作。
崛起的黏性:令人印象深刻的AI影片生成器
Ton Crafter:幀與幀之間的動畫
Domo AI:將影片轉換為卡通
Verse的魔法畫筆:選擇性動畫
音頻生成:下一級的音效
英偉達在Computex上:突破性公告
AMD和Intel在Computex上:專注於AI
思科Live:增強數位韌性
蘋果WWDC:對AI進步的期望
微軟和谷歌的回憶功能:隱私問題
AI創新的挑戰:加州法案
其他值得注意的AI發展
崛起的黏性:令人印象深刻的AI影片生成器
崛起的黏性:令人印象深刻的AI影片生成器
這個名為Cling的新AI視頻生成器來自中國,這週在AI界引起了熱議。如果你有中國手機號碼,reportedly你現在就可以註冊使用這個應用程式。
Cling生成的視頻通常長約5秒,但也有更長的例子。一個視頻展示了一個男孩騎自行車,隨著視頻的進展,環境從沙漠變為雪景。雖然這些視頻明顯是AI生成的,但它們卻非常逼真。
Cling還有一個功能,允許你上傳一張圖像和一個動作模板,它會將圖像動畫化以匹配該動作。這產生了一些創意十足且有趣的例子,比如一個男人在海灘上跳舞或人們吃各種食物。
總的來說,Cling AI視頻生成器似乎產生的結果比我們最近看到的其他許多視頻生成器都要好,但它們仍然無法完全匹敵Sora。我們很期待看到這個工具的發展,以及它是否會在中國以外變得更加普及。
Ton Crafter:幀與幀之間的動畫
Ton Crafter:幀與幀之間的動畫
Ton Crafter是一個很酷的AI工具,可以在兩個畫面之間進行動畫製作。你只需提供起始圖像和結束圖像,它就會生成中間的動畫過渡。
這個工具在卡通風格或動漫風格的圖像上效果最好,而不是真實的照片。它可以處理簡單的頭部轉動或角色行走等動作,並流暢地製作過渡動畫。
你現在可以在Hugging Face上免費使用Ton Crafter。只需上傳你的起始和結束圖像,工具就會生成動畫。這是一個開源項目,你也可以下載代碼並在自己的電腦上本地運行。
Ton Crafter的一些使用例子包括:
- 一個人拿著雨傘走在街上
- 一個發光的球體或寶石脈動和變化
- 一個卡通角色的頭部稍微轉動並眨眼
Domo AI:將影片轉換為卡通
Domo AI:將影片轉換為卡通
Domo AI是一個允許用戶將普通視頻畫面轉換為卡通風格動畫的工具。以下是它的工作原理:
- 用戶可以將視頻文件上傳到Domo AI平台。
- 該工具會對視頻進行處理,應用卡通風格的濾鏡和特效,創造出原始畫面的動畫版本。
- 這可以應用於各種視頻來源,包括電影、電視節目和用戶生成的內容。
- 生成的動畫視頻保留了原始的動作和行為,但具有天真、手繪的美學風格。
- Domo AI甚至處理了lip-syncing任務,確保卡通角色的嘴部動作與音頻同步。
這個工具提供了一種簡單的方法,可以為標準視頻賦予獨特的動畫外觀和感覺。它可用於創意項目、視頻評論,或只是為現有畫面增添一些視覺魅力。Domo AI使卡通轉換過程對廣大用戶來說都是可及的。
Verse的魔法畫筆:選擇性動畫
Verse的魔法畫筆:選擇性動畫
最近,Proper prompter分享了一個名為Verse的新工具,其中包括一個名為Magic Brush的功能。這個功能允許你選擇圖像的特定部分並只對該部分進行動畫化。
以下是Magic Brush功能的一些示例:
- 讓哈利·波特的魔杖動起來,手和魔杖都在移動。
- 讓埃隆·馬斯克的臉點頭。
- 讓火箭飛船起飛,噴出蒸汽。
- 讓霍格沃茨特快列車動起來,冒出蒸汽並移動。
Magic Brush功能似乎比類似的工具(如Runway)產生更好的結果,允許所選區域的動畫更加自然和流暢。用戶可以上傳一張圖像,選擇想要動畫化的部分,Verse的AI就會使該部分活起來。
這個工具為創作者提供了另一種強大的方式,可以為圖像添加動畫和運動,而無需對整個場景進行動畫製作。Magic Brush的選擇性使其成為各種用例(從視覺特效到創意項目)的多功能工具。
音頻生成:下一級的音效
音頻生成:下一級的音效
本週在AI生成音頻領域出現了一些令人興奮的進展。兩個值得注意的公告如下:
-
11 Labs的AI生成音效: 11 Labs展示了一項新功能,允許用戶提示任何音效,AI然後生成該音效。示例包括一個"獸人說'遠離,渺小的人類'"以及一個類似魔獸世界生物的獨特音效。
-
Stability AI的Stable Audio模型: Stability AI發布了一個名為Stable Audio的開源模型,可以生成長達47秒的音頻樣本和音效,包括鼓點、樂器旋律、環境音和製作元素。示例中展示的音頻質量相當出色。
這些在AI生成音頻方面的進展突出了這個領域的快速進步。用戶現在可以提示特定的音效或音頻樣本,AI模型能夠產生高質量、逼真的結果。這為音頻創作、音效設計以及各行業的音頻後期製作開闢了新的可能性。
隨著這些工具的不斷發展,我們可以期待在不久的將來看到更加令人印象深刻和多功能的AI驅動音頻生成功能。
英偉達在Computex上:突破性公告
英偉達在Computex上:突破性公告
Nvidia CEO Jensen Huang在Computex活動上做出了一些重大公告。以下是關鍵亮點:
-
Earth 2: Nvidia推出了Earth 2,這是整個地球的數字孿生,旨在更好地預測氣候變化和天氣。它可以進行超本地預報,精確到數十米,並接受大量天氣數據的訓練。
-
Nvidia Aces: Nvidia展示了其數字人類技術套件,能夠實時進行路徑跟蹤次表面散射,模擬光線與皮膚的相互作用,使其呈現柔軟、半透明的外觀。
-
GPU性能和效率: Nvidia證明其GPU計算能力遠超摩爾定律,而功耗卻大幅下降,實現了更高效的AI處理。
-
GPU路線圖: Nvidia概述了其GPU路線圖,包括即將推出的Blackwell、Reuben和未來幾代,計劃每年推出一款新GPU以推動持續進步。
-
Project G Assist: Nvidia推出了Project G Assist,這是一款AI驅動的助手,可以在玩家玩遊戲時回答問題並提供指導。
-
Nvidia的市場地位: Nvidia曾短暫超越蘋果成為世界第二大公司,突顯了其GPU技術在AI時代的日益重要性。
AMD和Intel在Computex上:專注於AI
AMD和Intel在Computex上:專注於AI
AMD在Computex上做出了一些重大公告,包括他們的下一代筆記本電腦處理器Ryzen AI 300系列。這款芯片採用了AMD的XDNA 2 NPU,據稱其計算能力比上一代提高5倍,能效提高一倍。Ryzen AI 300將於2024年7月開始應用於某些co-pilot PC。
Intel也推出了他們的Lunar Lake客戶端處理器架構,繼續推動AI驅動型PC的發展。他們展示了一個名為"AI Playground"的系統,包括使用穩定擴散模型的圖像生成器,以及一個提供類似ChatGPT的大型語言模型的"Answer"部分,可在用戶的電腦上本地運行。
關鍵的啟示是,所有主要的芯片製造商 - Nvidia、AMD、Intel和高通 - 都專注於開發專門針對AI處理優化的硬件。這反映了AI功能在消費者和企業計算中的日益重要性。Computex上宣布的新芯片和技術旨在使各種設備上的AI應用程序更加高效和強大。
思科Live:增強數位韌性
思科Live:增強數位韌性
Cisco在最近的Cisco Live活動中,重點關注於提高"數字韌性" - 即企業應對數字世界中可能出現的問題(如黑客攻擊、網絡安全威脅和數據完整性問題)的能力。
Cisco正在使用AI來幫助企業更好地監控和管理他們的數字基礎設施。他們開發了一款名為ThousandEyes的工具,利用AI監視公司的整個數字環境,並在出現問題時發出警報,幫助他們快速找到問題的根源。
雖然消費者可能無法直接使用Cisco的技術,但提供我們使用的服務和工具的企業公司很可能依賴於Cisco的基礎設施。通過利用AI增強數字韌性,Cisco旨在提高我們所依賴的數字系統的整體安全性和可靠性。
除了開發自己的AI驅動工具外,Cisco還宣布了一項10億美元的全球AI投資基金,以支持創新AI解決方案的發展。該公司認識到AI在確保我們數字世界的安全和穩定性方面將發揮關鍵作用。
蘋果WWDC:對AI進步的期望
蘋果WWDC:對AI進步的期望
蘋果即將舉行的全球開發者大會(WWDC)預計將是AI公告的重大事件。據報導,這家科技巨頭計劃在其產品陣容中推出一系列新的AI功能和能力。
其中一個關鍵期望是推出一個全新的"Apple Intelligence"平台,可能會取代目前的Siri人工智能。這個新系統預計將在自然語言處理、任務完成和與蘋果生態系統的集成方面提供顯著改進。
此外,蘋果還被傳將在其核心產品(如iPhone、iPad和Mac)中集成更多先進的AI功能。這可能包括改進的圖像識別、增強的語音命令和更智能的個人助理功能。
該公司還預計將展示其增強現實(AR)和混合現實(MR)技術的進展,這些技術很可能利用AI進行物體識別、場景理解和與數字內容的無縫集成。
此外,蘋果可能會推出新的開發者工具和API,使第三方應用程序創建者能夠利用公司的AI功能。這可能會導致蘋果生態系統中出現大量AI驅動的體驗。
總的來說,對於蘋果的WWDC活動,人們的期望很高,有望看到可能塑造公司產品和服務未來的重大AI驅動創新。隨著科技行業繼續重視AI開發,蘋果的公告將受到消費者和行業分析師的密切關注。
微軟和谷歌的回憶功能:隱私問題
微軟和谷歌的回憶功能:隱私問題
當一名黑客開發了一個工具來提取數據從微軟的新"回憶"功能時,這引發了關於隱私和數據保護的擔憂。作為回應,微軟已經做出了一些更新來解決這些問題:
- "回憶"功能現在默認關閉,需要用戶特別啟用。
- 查看時間線和搜索回憶數據需要提供在場證明。
- 將添加更多數據保護措施,包括即時解密和本地快照存儲(而不是雲端)。
- 用戶將擁有更多控制權,可以暫停、過濾和刪除保存在"回憶"功能中的內容。
微軟明顯正在努力解決"令人不安"的因素,並確保用戶對他們的數據擁有更多透明度和控制權。
谷歌也在探索為Chromebook開發類似的"記憶"功能,他們也正在努力消除這種功能可能引發的隱私問題。
關鍵的啟示是,隨著這些AI驅動的生產力功能變得更加普及,科技公司必須仔細平衡其利益和強大的隱私保護措施。開發者需要主動解決這些技術可能被濫用或利用的潛在問題。
常問問題
常問問題