Các video được tạo bởi AI vượt qua Sora? Các phát triển mới nhất được khám phá

Khám phá các công cụ tạo video AI mới nhất như Cling, Toncraftey, Domo AI và Stable Audio, cũng như các thông báo từ Nvidia, AMD, Intel, Qualcomm và Cisco về việc nâng cao khả năng AI. Khám phá các phim ngắn được tạo bằng AI tại Liên hoan phim Tribeca và trợ lý chơi game dựa trên AI của Microsoft.

14 tháng 2, 2025

party-gif

Khám phá những tiến bộ mới nhất trong việc tạo video AI, hoạt hình và hiệu ứng âm thanh đang đẩy mạnh ranh giới của những gì có thể. Khám phá những phát triển hấp dẫn từ các công ty công nghệ hàng đầu và cách những công cụ này có thể cách mạng hóa việc tạo nội dung.

Sự trỗi dậy của Cling: Trình tạo video AI ấn tượng

Chương trình tạo video AI mới được gọi là Cling, xuất phát từ Trung Quốc, đã trở thành tâm điểm của giới AI trong tuần này. Nếu bạn có số điện thoại Trung Quốc, bạn có thể đăng ký sử dụng ứng dụng này ngay bây giờ.

Video do Cling tạo ra thường khoảng 5 giây, nhưng cũng có ví dụ về video dài hơn. Một video cho thấy một cậu bé đi xe đạp, với môi trường chuyển từ sa mạc sang cảnh tuyết phủ khi video tiến triển. Mặc dù video rõ ràng là do AI tạo ra, nhưng chúng rất ấn tượng về mặt hiện thực.

Cling cũng có tính năng cho phép bạn tải lên một hình ảnh và một mẫu hành động, và nó sẽ hoạt hình hình ảnh để phù hợp với hành động. Điều này đã dẫn đến một số ví dụ sáng tạo và hấp dẫn, như một người đàn ông nhảy trên bãi biển hoặc mọi người ăn các loại thức ăn khác nhau.

Nói chung, trình tạo video AI Cling dường như đang tạo ra kết quả tốt hơn nhiều trình tạo video khác mà chúng ta đã thấy gần đây, mặc dù chúng vẫn chưa đạt được chất lượng của Sora. Sẽ rất thú vị để xem công cụ này phát triển như thế nào và liệu nó có trở nên phổ biến hơn bên ngoài Trung Quốc hay không.

Ton Crafter: Tạo hoạt ảnh giữa các khung hình

Ton Crafter là một công cụ AI tuyệt vời có thể hoạt hình giữa hai khung hình. Bạn cung cấp cho nó một hình ảnh bắt đầu và một hình ảnh kết thúc, và nó sẽ tạo ra hoạt hình ở giữa.

Công cụ này hoạt động tốt nhất với các hình ảnh kiểu hoạt hình hoặc anime, thay vì ảnh thực tế. Nó có thể lấy một cái quay đầu đơn giản hoặc một nhân vật đi một bước và hoạt hình chuyển tiếp một cách mượt mà.

Bạn có thể sử dụng Ton Crafter ngay bây giờ miễn phí trên Hugging Face. Chỉ cần tải lên hình ảnh bắt đầu và kết thúc của bạn, và công cụ sẽ tạo ra hoạt hình. Đây là một dự án mã nguồn mở, vì vậy bạn cũng có thể tải xuống mã và chạy nó cục bộ trên máy tính của riêng mình.

Một số ví dụ về Ton Crafter trong hành động bao gồm:

  • Một người đàn ông đi bộ trên đường phố với một cái ô
  • Một quả cầu hoặc viên ngọc phát sáng và thay đổi
  • Đầu của một nhân vật hoạt hình quay nhẹ và nhấp mắt

Domo AI: Chuyển đổi video thành hoạt hình

Domo AI là một công cụ cho phép người dùng biến video thông thường thành các hoạt hình kiểu hoạt hình. Đây là cách nó hoạt động:

  • Người dùng có thể tải lên tệp video lên nền tảng Domo AI.
  • Công cụ sau đó sẽ xử lý video, áp dụng các bộ lọc và hiệu ứng kiểu hoạt hình để tạo ra phiên bản hoạt hình của video gốc.
  • Điều này có thể được thực hiện cho các nguồn video khác nhau, bao gồm các đoạn phim từ phim, chương trình truyền hình và nội dung do người dùng tạo ra.
  • Video hoạt hình kết quả vẫn duy trì chuyển động và hành động ban đầu, nhưng với một phong cách vẽ tay ngộ nghĩnh.
  • Domo AI thậm chí còn xử lý các nhiệm vụ như đồng bộ hóa môi miệng, đảm bảo miệng của các nhân vật hoạt hình di chuyển đồng bộ với âm thanh.

Công cụ này cung cấp một cách dễ dàng để mang lại một diện mạo và cảm giác hoạt hình độc đáo cho các video tiêu chuẩn. Nó có thể được sử dụng cho các dự án sáng tạo, bài luận video hoặc đơn giản là để thêm một chút phong cách hình ảnh cho các đoạn video hiện có. Domo AI khiến quá trình chuyển đổi thành hoạt hình trở nên dễ tiếp cận với nhiều người dùng.

Cọ phép thuật của Verse: Hoạt ảnh chọn lọc

Proper prompter gần đây đã chia sẻ một công cụ mới được gọi là Verse, bao gồm một tính năng gọi là Magic Brush. Tính năng này cho phép bạn chọn một phần cụ thể của một hình ảnh và chỉ hoạt hình khu vực đó.

Dưới đây là một số ví dụ về những gì tính năng Magic Brush có thể làm:

  • Hoạt hình cây đũa phép của Harry Potter, với bàn tay và cây đũa phép di chuyển.
  • Hoạt hình khuôn mặt của Elon Musk, khiến ông gật đầu.
  • Hoạt hình một tên lửa phóng lên, với khói bay ra.
  • Hoạt hình tàu hỏa Hogwarts Express, với khói và chuyển động của tàu.

Tính năng Magic Brush dường như mang lại kết quả tốt hơn so với các công cụ tương tự như Runway, cho phép hoạt hình các khu vực được chọn một cách tự nhiên và mượt mà hơn. Người dùng có thể tải lên một hình ảnh, chọn phần muốn hoạt hình, và AI của Verse sẽ mang phần đó đến sự sống.

Công cụ này cung cấp một cách mạnh mẽ khác cho các nhà sáng tạo để thêm hoạt hình và chuyển động vào hình ảnh của họ, mà không cần phải hoạt hình toàn bộ cảnh. Tính chọn lọc của Magic Brush khiến nó trở thành một công cụ linh hoạt cho nhiều trường hợp sử dụng khác nhau, từ hiệu ứng hình ảnh đến các dự án sáng tạo.

Tạo ra âm thanh: Hiệu ứng âm thanh cấp cao

Tuần này đã chứng kiến một số diễn biến đáng chú ý trong lĩnh vực âm thanh do AI tạo ra. Hai thông báo đáng chú ý là:

  1. Hiệu ứng âm thanh do 11 Labs tạo ra: 11 Labs đã giới thiệu tính năng mới cho phép người dùng gợi ý bất kỳ hiệu ứng âm thanh nào, và AI sẽ tạo ra chúng. Ví dụ bao gồm một "troll nói 'hãy rời xa, con người nhỏ bé'" và một hiệu ứng âm thanh độc đáo giống như một sinh vật phong cách Warcraft.

  2. Mô hình Stable Audio của Stability AI: Stability AI đã phát hành một mô hình mã nguồn mở được gọi là Stable Audio, có thể tạo ra mẫu âm thanh và hiệu ứng âm thanh lên đến 47 giây, bao gồm nhịp trống, riff nhạc cụ, âm thanh môi trường và các yếu tố sản xuất. Chất lượng âm thanh được trình diễn trong các ví dụ khá ấn tượng.

Sự tiến bộ trong lĩnh vực âm thanh do AI tạo ra này nổi bật sự tiến triển nhanh chóng trong lĩnh vực này. Người dùng bây giờ có thể gợi ý các hiệu ứng âm thanh hoặc mẫu âm thanh cụ thể, và các mô hình AI có thể tạo ra kết quả chất lượng cao và thực tế. Điều này mở ra những khả năng mới cho việc tạo ra âm thanh, thiết kế âm thanh và thậm chí là hậu kỳ âm thanh trong các ngành công nghiệp khác nhau.

Khi các công cụ này tiếp tục phát triển, chúng ta có thể mong đợi thấy nhiều khả năng tạo ra âm thanh do AI mạnh mẽ và linh hoạt hơn trong tương lai gần.

Nvidia tại Computex: Các thông báo đột phá

Jensen Huang, Giám đốc điều hành của Nvidia, đã đưa ra một số thông báo đáng kể trong sự kiện Computex. Dưới đây là những điểm chính:

  1. Earth 2: Nvidia đã giới thiệu Earth 2, một bản sao kỹ thuật số của toàn bộ Trái Đất được thiết kế để giúp dự đoán biến đổi khí hậu và thời tiết tốt hơn. Nó có thể thực hiện dự báo siêu cục bộ xuống đến hàng chục mét, được đào tạo trên lượng lớn dữ liệu thời tiết.

  2. Nvidia Aces: Nvidia đã giới thiệu bộ công nghệ nhân vật kỹ thuật số của mình, cho phép quét đường dẫn thời gian thực để mô phỏng cách ánh sáng tương tác với da, tạo ra một vẻ ngoài mềm mại và trong suốt.

  3. Hiệu suất và hiệu quả của GPU: Nvidia đã chứng minh rằng sức mạnh tính toán GPU của mình đang vượt xa Định luật Moore, trong khi mức tiêu thụ điện năng đã giảm đáng kể, cho phép xử lý AI hiệu quả hơn.

  4. Lộ trình GPU: Nvidia đã phác thảo lộ trình GPU của mình, với các thế hệ Blackwell, Reuben và tương lai, dự định phát hành một GPU mới mỗi năm để thúc đẩy sự tiến bộ liên tục.

  5. Project G Assist: Nvidia đã giới thiệu Project G Assist, một trợ lý dựa trên AI có thể giúp game thủ bằng cách trả lời câu hỏi và cung cấp hướng dẫn trong khi họ đang chơi trò chơi video.

  6. Vị thế thị trường của Nvidia: Nvidia đã tạm thời vượt qua Apple để trở thành công ty lớn thứ hai trên thế giới, nhấn mạnh tầm quan trọng ngày càng tăng của công nghệ GPU trong kỷ nguyên AI.

AMD và Intel tại Computex: Tập trung vào AI

AMD đã công bố một số thông báo lớn tại Computex, bao gồm bộ xử lý máy tính xách tay thế hệ tiếp theo của họ, Ryzen AI 300 series. Chip này có NPU XDNA 2 của AMD, mà họ tuyên bố có năng lực tính toán gấp 5 lần và hiệu quả năng lượng gấp đôi so với thế hệ trước. Ryzen AI 300 sẽ được tích hợp vào một số máy tính co-pilot bắt đầu từ tháng 7 năm 2024.

Intel cũng đã giới thiệu kiến trúc bộ xử lý máy tính khách hàng Lunar Lake, tiếp tục phát triển danh mục máy tính PC được hỗ trợ bởi AI. Họ đã trình diễn "AI Playground" của mình, bao gồm một bộ tạo hình ảnh sử dụng các mô hình Stable Diffusion, cũng như một phần "Answer" cung cấp một mô hình ngôn ngữ lớn giống ChatGPT chạy cục bộ trên máy tính của người dùng.

Kết luận chính là tất cả các nhà sản xuất chip chính - Nvidia, AMD, Intel và Qualcomm - đều tập trung vào việc phát triển phần cứng được tối ưu hóa đặc biệt cho xử lý AI. Điều này phản ánh tầm quan trọng ngày càng tăng của các khả năng AI trong máy tính tiêu dùng và doanh nghiệp. Các chip và công nghệ mới được công bố tại Computex nhằm mục đích cho phép các ứng dụng AI hiệu quả và mạnh mẽ hơn trên nhiều thiết bị khác nhau.

Cisco Live: Tăng cường khả năng phục hồi kỹ thuật số

Trọng tâm của Cisco tại sự kiện Cisco Live gần đây là cải thiện "khả năng chống chịu kỹ thuật số" - khả năng của các công ty xử lý các vấn đề có thể phát sinh trong thế

Câu hỏi thường gặp