Khám phá tin tức AI mới nhất: Tổng hợp toàn diện

Khám phá tin tức và cập nhật mới nhất về trí tuệ nhân tạo, từ dự án trung tâm dữ liệu 100 tỷ đô la của Microsoft đến mô hình giọng nói và quyền truy cập ChatGPT của OpenAI. Khám phá cách trí tuệ nhân tạo đang gây rối các ngành công nghiệp và phát triển nhanh chóng. Cập nhật về những phát triển mới nhất trong công nghệ biến đổi này.

22 tháng 4, 2025

Khám phá những bước đột phá mới nhất về trí tuệ nhân tạo và cập nhật ngành công nghiệp trong bài đăng blog toàn diện này. Khám phá cảnh quan trí tuệ nhân tạo đang phát triển nhanh chóng, từ dự án trung tâm dữ liệu tham vọng của Microsoft và OpenAI đến công nghệ tạo giọng nói đột phá của OpenAI. Cập nhật những diễn biến mới nhất định hình tương lai của trí tuệ nhân tạo.

Điều hướng các thách thức và cơ hội của các giọng nói tổng hợp
Inpainting trong Dolly 3
Tạo ra âm thanh từ âm thanh trong Stable Audio 2.0
Thư của các nhạc sĩ chống lại việc sử dụng AI thiếu trách nhiệm
Tính năng trộn ảnh mới của Crea AI
Tác động của AI đối với việc làm và Hội đồng Lực lượng Lao động ICT
Sử dụng bằng chứng video được tăng cường bởi AI trong tòa án
Tương tác với người khác trong Apple Vision Pro
Xe scooter điện tự lái hoàn toàn đầu tiên và giao hàng Uber Eats tự lái
AI như một thành viên trong chương trình The Circle của Netflix
Kết luận

Điều hướng các thách thức và cơ hội của các giọng nói tổng hợp

Open AI đã tạo ra một mô hình giọng nói có thể tạo ra giọng nói thực tế từ một mẫu 15 giây. Âm thanh được tạo ra có chất lượng cao, thậm chí vượt qua khả năng của các công cụ như Eleven Labs.

Mặc dù công nghệ này mang lại những khả năng đầy hứa hẹn, Open AI công nhận những rủi ro tiềm ẩn. Họ không công bố mô hình này công khai, vì họ muốn đảm bảo nó không bị lạm dụng.

Để giải quyết các thách thức, Open AI khuyến khích các bước như:

Loại bỏ xác thực dựa trên giọng nói làm biện pháp bảo mật
Khám phá các chính sách để bảo vệ việc sử dụng giọng nói của cá nhân
Giáo dục công chúng về khả năng của nội dung AI được tạo ra có thể lừa đảo
Đẩy nhanh việc phát triển và áp dụng các kỹ thuật để theo dõi nguồn gốc của nội dung âm thanh và hình ảnh

Bằng cách áp dụng một cách tiếp cận có trách nhiệm, Open AI nhằm mục đích giải quyết các phức tạp của giọng nói tổng hợp và đảm bảo công nghệ này được sử dụng theo cách có lợi cho xã hội đồng thời giảm thiểu các tác hại tiềm ẩn.

Inpainting trong Dolly 3

Open AI đã thêm một tính năng mới là inpainting vào Dolly 3, mô hình tạo hình ảnh của họ. Điều này cho phép người dùng chọn một khu vực của hình ảnh được tạo ra và nhắc mô hình thực hiện thay đổi đối với khu vực cụ thể đó.

Ví dụ, nếu bạn tạo ra một hình ảnh với Dolly và không hài lòng với một số yếu tố, như bánh xe trên một chiếc ván lượn sóng, bạn có thể đánh dấu những khu vực đó và nhắc mô hình "loại bỏ các bánh xe". Dolly sau đó sẽ tạo lại phần đó của hình ảnh, cố gắng loại bỏ các bánh xe theo yêu cầu.

Khả năng inpainting này cung cấp cho người dùng nhiều quyền kiểm soát và linh hoạt hơn khi làm việc với các hình ảnh được tạo ra bởi Dolly. Nó cho phép tinh chỉnh và chỉnh sửa từng bước, thay vì phải bắt đầu từ đầu. Tuy nhiên, tính năng này vẫn có thể cần vài lần thử để đạt được kết quả mong muốn, vì mô hình không phải lúc nào cũng thực hiện hoàn hảo các thay đổi được yêu cầu.

Nói chung, việc bổ sung tính năng inpainting là một cải tiến hữu ích cho Dolly 3, trao quyền cho người dùng để tinh chỉnh và tùy chỉnh các hình ảnh được tạo ra bởi mô hình.

Tạo ra âm thanh từ âm thanh trong Stable Audio 2.0

Stability AI trong tuần này đã công bố Stable Audio 2.0, bao gồm một tính năng mới được gọi là tạo ra âm thanh từ âm thanh. Với tính năng này, bạn có thể huýt sáo hoặc tạo ra âm thanh của các nhạc cụ bằng miệng, và AI sẽ cố gắng nhân bản lại điều đó bằng âm thanh được tạo ra.

Dưới đây là một ví dụ:

[Âm nhạc]

Mặc dù tính năng này thú vị, nhạc được tạo ra chưa đạt đến mức chất lượng hoặc hấp dẫn như những công cụ như Jukebox. Các bài hát được tạo ra bởi Stable Audio 2.0 vẫn còn khá cơ bản và thiếu sự phức tạp và phong phú của nhạc do con người sáng tác.

Nói chung, tính năng tạo ra âm thanh từ âm thanh trong Stable Audio 2.0 là một bước tiến, nhưng vẫn còn nhiều chỗ để cải thiện trước khi có thể thực sự cạnh tranh với sản xuất âm nhạc chuyên nghiệp.

Thư của các nhạc sĩ chống lại việc sử dụng AI thiếu trách nhiệm

Một nhóm nhạc sĩ, bao gồm Nicki Minaj, Billy Eilish và Katy Perry, đã ký một bức thư phản đối việc sử dụng AI một cách không có trách nhiệm trong ngành công nghiệp âm nhạc. Các điểm chính từ bức thư là:

Những người ký tên kêu gọi các nhà phát triển AI, công ty công nghệ, nền tảng và dịch vụ âm nhạc kỹ thuật số ngừng sử dụng AI vi phạm và làm giảm giá trị của các quyền của nghệ sĩ con người.
Tuy nhiên, bức thư công nhận rằng khi được sử dụng một cách có trách nhiệm, AI có tiềm năng to lớn để thúc đẩy sáng tạo của con người và tạo ra những trải nghiệm mới và hấp dẫn cho người hâm mộ âm nhạc.
Bức thư bày tỏ lo ngại về "việc sử dụng AI theo cách bóc lột để đánh cắp giọng nói và hình ảnh của nghệ sĩ chuyên nghiệp, vi phạm quyền của người sáng tạo và phá hủy hệ sinh thái âm nhạc".
Những người ký tên tuyên bố rằng "cuộc tấn công vào sáng tạo của con người phải được ngừng lại" và họ phải bảo vệ chống lại việc lạm dụng AI có thể gây hại cho nghệ sĩ và ngành công nghiệp âm nhạc.
Nói chung, bức thư thể hiện một lập trường thận trọng, công nhận cả những lợi ích tiềm năng và rủi ro của AI trong âm nhạc, và kêu gọi phát triển và sử dụng công nghệ này một cách có trách nhiệm để bảo vệ quyền và sinh kế của các nghệ sĩ con người.

Tính năng trộn ảnh mới của Crea AI

Crea AI, công cụ tạo hình ảnh dựa trên AI, gần đây đã triển khai một tính năng mới "Image Blend". Tính năng này cho phép người dùng tải lên nhiều hình ảnh, điều chỉnh trọng số của mỗi hình ảnh và xem kết quả hình ảnh được kết hợp theo thời gian thực.

Ví dụ, nhóm Crea AI đã trình diễn tính năng này bằng cách tải lên ba hình ảnh với lời nhắc "cá làm bằng sứ trắng". Khi họ điều chỉnh trọng số của các hình ảnh khác nhau, hình ảnh đầu ra liên tục kết hợp các yếu tố từ các nguồn hình ảnh khác nhau.

Khả năng mới này rất ấn tượng, vì nó cho phép người dùng kết hợp một cách liền mạch các yếu tố hình ảnh khác nhau thành một hình ảnh thống nhất. Việc kết hợp theo thời gian thực cho phép thử nghiệm và tinh chỉnh nhanh chóng, khiến Crea AI trở thành một công cụ mạnh mẽ hơn nữa cho sự sáng tạo và ý tưởng.

Khả năng kết hợp nhiều hình ảnh mở ra những khả năng mới cho người dùng Crea AI, cho phép họ tạo ra các bản phối hợp hình ảnh phức tạp và tinh tế hơn. Tính năng này tiếp tục chứng minh những tiến bộ không ngừng trong việc tạo hình ảnh dựa trên AI, mở rộng giới hạn của công nghệ này.

Tác động của AI đối với việc làm và Hội đồng Lực lượng Lao động ICT

Sự phát triển nhanh chóng của công nghệ AI đã gây ra lo ngại về tác động tiềm năng đối với việc làm. Nhiều công ty công nghệ lớn hiện đang hợp lại với nhau để giải quyết vấn đề này thông qua Liên minh Lực lượng Lao động ICT.

Liên minh, bao gồm các công ty như Cisco, Google, Microsoft và IBM, nhằm tìm cách ngăn chặn người lao động mất việc do sự phát triển của AI. Mục tiêu là tìm ra cách để giữ cho mọi người có việc làm khi AI tiếp tục phát triển và có thể tự động hóa một số nhiệm vụ.

Đây là một sáng kiến quan trọng, vì đã có báo cáo về các công ty công nghệ lớn như Google sa thải hàng nghìn nhân viên, với một số suy đoán rằng AI là một yếu tố góp phần. Tuy nhiên, sự thật là những đợt sa thải này chủ yếu là do các công ty tái cơ cấu để tập trung nhiều hơn vào phát triển AI, chứ không phải AI trực tiếp thay thế công nhân.

Tuy nhiên, tiềm năng của AI trong việc gây rối các vai trò công việc truyền thống là có thật, và Liên minh Lực lượng Lao động ICT là một bước tiến chủ động để giải quyết thách thức này. Bằng cách tập hợp các lãnh đạo ngành, liên minh nhằm mục đích phát triển các chiến lược và giải pháp để giúp người lao động thích ứng với bối cảnh việc làm đang thay đổi và đảm bảo rằng lợi ích của AI được chia sẻ rộng rãi, thay vì tập trung vào một số công ty công nghệ lớn.

Khi AI tiếp tục phát triển, việc các công ty, nhà hoạch định chính sách và người lao động hợp tác và tìm cách khai thác sức mạnh của công nghệ này đồng thời bảo vệ việc làm và sinh kế sẽ là điều quan trọng. Liên minh Lực lượng Lao động ICT đại diện cho một bước tiến quan trọng trong hướng đó.

Sử dụng bằng chứng video được tăng cường bởi AI trong tòa án

Một tòa án ở Washington đã cấm sử dụng bằng chứng video được tăng cường bằng AI. Mối lo ngại là các công cụ tăng cấp dựa trên AI, như Topaz Labs, thực sự không cải thiện chất lượng của đoạn phim. Thay vào đó, AI cố gắng đoán các điểm ảnh ở giữa, có thể thêm hoặc thay đổi các chi tiết không có trong đoạn phim ban đầu. Điều này làm nảy sinh vấn đề về độ tin cậy và tính xác thực của bằng chứng, khiến nó không phù hợp để sử dụng trong các thủ tục tố tụng. Phán quyết này nhấn mạnh sự cần thiết phải thận trọng khi sử dụng các phương tiện truyền thông được tăng cường bằng AI, vì công nghệ này có thể vô tình giới thiệu các sai sót hoặc sự méo mó, làm suy giảm tính toàn vẹn của bằng chứng.

Tương tác với người khác trong Apple Vision Pro

Apple Vision Pro hiện cho phép người dùng tương tác với người khác trong các môi trường ảo. Một số tính năng chính bao gồm:

Trình diễn ảo: Người dùng có thể xuất hiện như một cái đầu lơ lửng với bàn tay để trình bày nội dung và hợp tác với người khác trong các không gian ảo.
Trò chơi ảo: Người dùng có thể chơi các trò chơi bàn cờ, cờ vua và các trải nghiệm tương tác khác với những người tham gia từ xa. Điều này cho phép có những trải nghiệm chơi game chung trong thiết bị đeo.
Xem phim cùng nhau: Người dùng có thể xem phim hoặc nội dung khác cùng nhau, với mỗi người tham gia xuất hiện như một sự hiện diện ảo trong môi trường chung.

Khả năng tương tác với người khác trên Apple Vision Pro đại diện cho một bước tiến quan trọng trong việc biến thiết bị đeo thành một nền tảng xã hội và hợp tác hơn, vượt ra khỏi trải nghiệm cô lập của các thiết bị thực tế ảo trước đây. Những tính năng mới này cho phép người dùng tham gia với bạn bè, đồng nghiệp và những người khác trong

Câu hỏi thường gặp

Bức tranh 'MAD' năm 2024 là gì?

Kế hoạch xây dựng trung tâm dữ liệu 100 tỷ đô la giữa Microsoft và OpenAI là gì?

OpenAI đã phát triển những khả năng tạo giọng nói mới nào?

Tính năng mới nào đã được thêm vào DALL-E?

CEO của YouTube đã nói gì về việc mô hình Whisper của Anthropic có thể được đào tạo trên các video của YouTube?

Stable Diffusion 2.0 có những khả năng tạo nhạc AI mới nào?

Các nghệ sĩ âm nhạc đã bày tỏ những lo ngại gì về việc sử dụng AI một cách không có trách nhiệm?

Những tính năng mới nào đã được thêm vào Craiyon (DALL-E)?

Tòa án ở Washington đã quyết định gì về việc sử dụng bằng chứng video được tăng cường bằng AI?

Những tính năng xã hội mới nào đã được thêm vào kính thực tế ảo Apple Vision Pro?

Những phát triển AI kỳ lạ nào được đề cập trong video?

Tạo bạn gái AI của bạn

Xây dựng người bạn đồng hành lý tưởng của bạn với AI Girlfriend Builder của chúng tôi