Tin tức về AI: Một Tuần Bận Rộn với Các Tiến Bộ và Phát Triển trong Lĩnh Vực AI

Khám phá những tiến bộ và phát triển mới nhất về trí tuệ nhân tạo trong tuần qua, bao gồm tính năng giọng nói nâng cao của OpenAI, khả năng tạo ra đầu ra dài của GPT-4, các tuyên bố về cuộc thi AI của Microsoft và các bản cập nhật từ Google, Anthropic, Meta và nhiều hơn nữa. Hãy luôn đi trước xu hướng trong thế giới AI đang không ngừng phát triển.

14 tháng 2, 2025

Bài đăng blog này cung cấp một tổng quan toàn diện về những tiến bộ mới nhất trong thế giới của trí tuệ nhân tạo, bao phủ một loạt chủ đề từ các tính năng giọng nói mới trong ChatGPT của OpenAI đến việc Canva mua lại Leonardo AI. Độc giả sẽ có được những hiểu biết về bức tranh AI đang nhanh chóng thay đổi và những phát triển hấp dẫn đang định hình tương lai của công nghệ này.

Tính năng Giọng nói Nâng cao của Open AI
Đầu ra Dài của GPT-4
Open AI như một Đối thủ của Microsoft
Sự Ủng hộ của Open AI đối với Quy định về AI
Anthropic Khởi động Claud tại Brazil
Gemini 1.5 Pro và Các Mô hình AI Khác của Google
Các Tính năng AI Mới của Google Chrome
Chatbots AI đã Bị Loại bỏ và Phòng Làm việc AI Mới của Meta
Mô hình Segment Anything 2 của Meta
Chương trình Nhà Xuất bản Perplexity
Leonardo AI Được Mua lại bởi Canva
Cập nhật 6.1 của Mid Journey
Các Bộ Tạo Mô hình 3D Mới
Mô hình Flux Mới của Black Forest Labs
Chuyển Ảnh sang Video và Gen 3 Alpha Turbo của Runway
Các Nhân vật và Ảnh hưởng gia Được Tạo bằng AI
Dịch Tự động Video của Vimeo
Phản hồi của Anthropic đối với Các Vụ kiện
Tranh cãi xung quanh Vòng cổ AI "Bạn"
Tin tức AI Khác

Tính năng Giọng nói Nâng cao của Open AI

Open AI đã bắt đầu triển khai một tính năng giọng nói nâng cao cho một số người dùng được chọn. Tính năng mới này cho phép người dùng tạo ra các giọng nói giống con người, bao gồm cả khả năng bắt chước giọng nói của Scarlett Johansson.

Một số điểm nổi bật của chế độ giọng nói nâng cao:

Người dùng có quyền truy cập có thể thử tùy chọn "Chế độ Giọng nói Nâng cao" ở cuối cửa sổ trò chuyện.
Nó có thể tạo ra các giọng nói rất giống thật, bao gồm cả khả năng bắt chước giọng nói của các ngôi sao và nhân vật công cộng.
Người dùng có thể ngắt tiếng nói trong khi nó đang nói, một tính năng không có trong ứng dụng chat GPT tiêu chuẩn.
Các bản demo cho thấy mô hình giọng nói có thể đếm rất nhanh, thậm chí mô phỏng nhu cầu thở.

Đầu ra Dài của GPT-4

Open AI gần đây đã triển khai một phiên bản thử nghiệm của GPT-4 có tên "GPT-4 Long Output". Mô hình mới này có đầu ra tối đa 64.000 token mỗi yêu cầu, cho phép các phản hồi dài hơn và chi tiết hơn nhiều so với mô hình GPT-4 tiêu chuẩn.

Mô hình GPT-4 Long Output hiện chỉ có sẵn cho một nhóm người tham gia Alpha và chưa được công chúng tiếp cận. Phiên bản thử nghiệm này được thiết kế để cung cấp cho người dùng khả năng tạo ra các đầu ra cực kỳ dài và toàn diện để đáp ứng các truy vấn của họ.

Mặc dù chi tiết về kiến trúc và quá trình đào tạo của mô hình chưa được công bố công khai, nhưng độ dài đầu ra tăng lên có thể đạt được thông qua các tiến bộ trong khả năng lưu trữ và suy luận của mô hình. Điều này cho phép mô hình duy trì ngữ cảnh và tính liên kết trên một đoạn văn bản dài hơn nhiều, cho phép nó cung cấp các phản hồi chi tiết và sâu sắc hơn.

Các ứng dụng tiềm năng của mô hình GPT-4 Long Output rất rộng, từ các nhiệm vụ nghiên cứu và phân tích mở rộng đến việc tạo ra nội dung dài như báo cáo, luận văn hoặc thậm chí là sách. Tuy nhiên, như với bất kỳ công nghệ AI mạnh mẽ nào, cũng có những lo ngại về việc sử dụng sai mục đích hoặc những hậu quả không mong muốn của một mô hình như vậy.

Open AI như một Đối thủ của Microsoft

Tuần này, Microsoft đang tuyên bố rằng Open AI là một đối thủ cạnh tranh trong lĩnh vực AI và tìm kiếm. Điều này thú vị vì Microsoft đã nổi tiếng với việc đầu tư 13 tỷ đô la vào Open AI và sở hữu 49% công ty.

Trong các báo cáo tài chính của họ, Microsoft liệt kê các công ty bao gồm Anthropic, Open AI, Meta và các sản phẩm nguồn mở khác là đối thủ cạnh tranh cho các sản phẩm AI của họ. Điều này thật kỳ lạ khi Open AI được Microsoft sở hữu 49% và họ cũng có các thỏa thuận hợp tác với Meta.

Có vẻ như Microsoft hiện đang xem Open AI là đối thủ cạnh tranh với hoạt động quảng cáo tìm kiếm và tin tức của riêng họ, mặc dù họ nắm giữ một phần lớn trong công ty. Đây là một động thái rất thú vị đã phát triển giữa hai công ty.

Sự Ủng hộ của Open AI đối với Quy định về AI

Tuần này, Open AI đã ủng hộ một số dự luật Thượng viện liên quan đến quy định và an toàn AI. Điều này bao gồm Đạo luật Tương lai của Đổi mới AI, sẽ chính thức ủy quyền Viện An toàn AI của Hoa Kỳ là một cơ quan liên bang để thiết lập các tiêu chuẩn và hướng dẫn cho các mô hình AI.

Open AI cũng ủng hộ Đạo luật Giáo dục AI của NSF và Đạo luật CREATE AI, cung cấp học bổng liên bang cho nghiên cứu AI và thiết lập các nguồn lực giáo dục AI trong các trường đại học và trường phổ thông.

Các lời ủng hộ này từ Open AI có thể phục vụ để giúp công ty có một chỗ đứng trong các cuộc thảo luận trong tương lai về quy định AI. Là một công ty AI lớn, Open AI là ứng cử viên có khả năng phải đối mặt với sự kiểm tra quy định trong tương lai. Bằng cách ủng hộ các dự luật này, Open AI có thể định hình hướng đi của quy định và đảm bảo lợi ích của họ được đại diện.

Anthropic Khởi động Claud tại Brazil

Tin tốt cho những người ở Brazil - Anthropic đã ra mắt trợ lý AI của họ là Claud tại quốc gia này trong tuần này. Claud hiện đã có sẵn để người dùng ở Brazil truy cập và tương tác.

Google cũng đã gây được những làn sóng lớn trong thế giới AI tuần này. Họ đã phát hành một phiên bản mới của Gemini 1.5 Pro, gọi là phiên bản 0801 hiện có sẵn để sử dụng bên trong Google AI Studio.

Để truy cập, bạn có thể truy cập vào AI Studio .g google.com và trong menu "Model", bạn sẽ thấy "Gemini 1.5 Pro experimental 0801" - đó là mô hình bạn muốn sử dụng.

Khi trò chuyện với mô hình Gemini 1.5 Pro mới này, nó đã vượt lên đầu bảng xếp hạng trên lm.org, thậm chí vượt qua cả GPT-4, GPT-4 Mini, CLAE 3.5 và Sonet.

Google cũng đã phát hành một phiên bản nhỏ hơn mới của mô hình Gemini 2 của họ - một mô hình 2 tỷ tham số được xây dựng để có hiệu suất và hiệu quả nhanh hơn, có thể dành cho các thiết bị di động. Đáng chú ý, mô hình 2 tỷ tham số này vượt qua các mô hình lớn hơn nhiều như Mixdral 8X 7B, GPT-3.5 Turbo và LLaMA 2 70 tỷ.

Gemini 1.5 Pro và Các Mô hình AI Khác của Google

Tuần này, Google đã thêm một số tính năng AI ấn tượng mới vào trình duyệt Chrome của họ, bao gồm tích hợp Google Lens có thể nhận dạng và tìm kiếm các đối tượng trong ảnh, và một tính năng so sánh mới có thể so sánh các sản phẩm trên các trang web khác nhau.

Các Tính năng AI Mới của Google Chrome

Tuần này, Google đã thêm một số tính năng mới được hỗ trợ bởi AI vào trình duyệt Chrome của họ:

Google Lens trên Chrome Desktop: Bạn bây giờ có thể sử dụng Google Lens để tìm kiếm thông tin về các đối tượng trong ảnh trực tiếp từ trình duyệt Chrome. Chỉ cần chọn một khu vực của một hình ảnh và Lens sẽ tìm kiếm các sản phẩm tương tự hoặc nhận dạng đối tượng.
So sánh Sản phẩm: Chrome bây giờ có một tính năng tích hợp cho phép bạn so sánh các sản phẩm trên các tab và trang web khác nhau. Điều này giúp dễ dàng nghiên cứu và so sánh các mặt hàng mà không cần chuyển đổi giữa các tab.
Lịch sử Tìm kiếm Ngôn ngữ Tự nhiên: Bây giờ bạn có thể sử dụng ngôn ngữ tự nhiên để tìm kiếm lịch sử duyệt web của Chrome. Ví dụ, bạn có thể hỏi "Cửa hàng kem nào mà tôi đã tìm kiếm tuần trước?" và Chrome sẽ hiển thị thông tin liên quan từ lịch sử tìm kiếm của bạn.

Chatbots AI đã Bị Loại bỏ và Phòng Làm việc AI Mới của Meta

Tuần này, Meta đã kết thúc một trong những tính năng họ đã công bố tại Meta Connect năm ngoái. Họ đã trình diễn các trò chuyện bot AI trông giống những người nổi tiếng, nhưng không phải là các bot chat của những người nổi tiếng đó - họ chỉ sử dụng khuôn mặt của họ nhưng được đào tạo trên thông tin khác. Tuy nhiên, không ai thực sự thích chúng, vì vậy Meta đã loại bỏ chúng.

Nhưng họ đã thay thế nó bằng một cái gì đó khác - bây giờ, bất kỳ ai cũng có thể tạo ra AI tùy chỉnh của riêng mình. Meta đã triển khai một Studio AI, và một trong những người bạn của tôi, Don Allen Stevenson, là một trong những người nhận được quyền truy cập sớm.

Tính năng mới này cho phép bất kỳ ai tạo ra các nhân vật AI dựa trên sở thích của họ. Bạn có thể truy cập vào ai.meta.com/AI-Studio và tạo ra nhân vật AI tùy chỉnh của riêng mình, chọn các tùy chọn như thú cưng AI, gia sư riêng, người đồng hành, nghệ sĩ sáng tạo, bảng tham khảo, nhà thiết kế sáng tạo, nhà tư vấn thời trang cá nhân và nhiều hơn nữa.

Mô hình Segment Anything 2 của Meta

Meta đã phát hành một phiên bản mới của Mô hình Phân đoạn Bất kỳ (SAM 2) của họ. Đây là một mô hình có thể phân đoạn các phần nhất định của một hình ảnh hoặc video với độ chính xác ấn tượng, thậm chí theo dõi các đối tượng khi chúng di chuyển xung quanh. Đây là một bước cải thiện lớn so với các mô hình phân đoạn trước đây và có thể rất hữu ích cho các tác vụ chỉnh sửa video như rotoscoping. Bạn có thể thử SAM 2 tại sam2.metademolab.com.

Chương trình Nhà Xuất bản Perplexity

Perplexity, công cụ tìm kiếm được hỗ trợ bởi AI, đã công bố Chương trình Nhà Xuất bản Perplexity. Chương trình này nhằm chia sẻ doanh thu với các đối tác cụ thể mà nội dung của họ được sử dụng làm nguồn tin trên nền tảng Perplexity.

Lô đối tác ban đầu được bao gồm trong chương trình này là:

Time
Der Spiegel
Fortune
Entrepreneur
The Texas Tribune
WordPress.com

Mặc dù chương trình này hiện chỉ bao gồm các nhà xuất bản lớn, Perplexity đã bày tỏ hy vọng rằng trong tương lai, họ sẽ có thể khuyến khích các blogger và nhà tạo nội dung bình thường cấp phép nội dung của họ cho nền tảng này.

Leonardo AI Được Mua lại bởi Canva

Tuần này, tin lớn là Leonardo AI, một trong những công cụ tạo hình ảnh AI hàng đầu, đã được Canva, nền tảng thiết kế, mua lại. Đây là một diễn biến đáng chú ý vì một số lý do:

Tích hợp với Canva: Với Leonardo AI bây giờ là một phần của hệ sinh thái Canva, người dùng sẽ cuối cùng có thể truy cập vào các khả năng tạo hình ảnh AI mạnh mẽ trực tiếp trong nền tảng Canva. Điều này sẽ giúp dễ dàng hơn bao giờ hết để tạo ra các hình ảnh chất lượng cao được tạo bởi AI mà không cần phải chuyển giữa nhiều công cụ.
Cải thiện AI của Canva: Các khả năng tạo hình ảnh AI hiện tại của Canva đã hơi kém so với các công cụ khác như DALL-E và Midjourney

Câu hỏi thường gặp

OpenAI đang bắt đầu triển khai tính năng giọng nói nâng cao mới là gì?

Tính năng đầu ra dài mới của GPT-4 mà OpenAI đã triển khai là gì?

Microsoft đang xem OpenAI như một đối thủ cạnh tranh như thế nào?

Google đã phát hành những tính năng AI mới nào?

Meta đã phát hành những tính năng AI mới nào?

Những công cụ video được hỗ trợ bởi AI mới nào đã được phát hành?

Các công ty AI đã đối mặt với những vấn đề pháp lý nào?

Những tin tức đáng chú ý khác về AI đã xảy ra trong tuần này?

Tạo bạn gái AI của bạn

Xây dựng người bạn đồng hành lý tưởng của bạn với AI Girlfriend Builder của chúng tôi