AGI Gần Hơn Chúng Ta Nghĩ: Dự Đoán Táo Bạo 3-5 Năm Tới Của Nhà Nghiên Cứu Của OpenAI

Khám phá dự đoán táo bạo trong 3-5 năm tới của một nhà nghiên cứu của OpenAI về lộ trình của Trí tuệ Nhân tạo Tổng quát (AGI). Tìm hiểu các thành phần chính của trí thông minh tổng quát và những hiểu biết về tiến bộ trong các mô hình thế giới, tư duy hệ thống 2 và sự nhập thể. Khám phá sự hội tụ tiềm năng của robotics và các mô hình ngôn ngữ lớn, gợi ý về một tương lai AGI đầy hứa hẹn.

6 tháng 4, 2025

Khám phá những hiểu biết đáng chú ý từ một nhà nghiên cứu của OpenAI về những tiến bộ nhanh chóng trong trí tuệ nhân tạo tổng quát (AGI) và cách chúng ta có thể gần với cột mốc này hơn bạn nghĩ. Khám phá các thành phần chính cần thiết để xây dựng một tác nhân thông minh tổng quát và tìm hiểu về lộ trình tiềm năng để đạt được AGI trong những năm tới.

Các thành phần chính của một tác nhân thông minh tổng quát
Xây dựng mô hình thế giới và cải thiện tính chắc chắn
Những người hoài nghi, Transformers và con đường đến AGI
Tầm quan trọng của Hệ thống 2 Suy nghĩ
Hiện thể hóa và sự hội tụ của Robotics và Mô hình Ngôn ngữ
Các dòng thời gian lạc quan của Nhà nghiên cứu về AGI

Các thành phần chính của một tác nhân thông minh tổng quát

Một thực thể thông minh tổng quát đòi hỏi phải có sự kết hợp của ba thành phần chính:

Một cách để tương tác và quan sát một môi trường phức tạp: Điều này thường có nghĩa là sự thể hiện - khả năng nhận thức và tương tác với thế giới tự nhiên bằng các đầu vào cảm giác khác nhau như chạm, ngửi, nhìn, v.v. Điều này cho phép thực thể xây dựng một mô hình thế giới vững chắc bao phủ môi trường.
Một cơ chế để thực hiện sự tự phản ánh sâu sắc về các chủ đề tùy ý: Đây là khả năng suy luận, hoặc "suy nghĩ chậm" (suy nghĩ hệ thống 2), nơi thực thể có thể suy nghĩ sâu sắc về các vấn đề và đưa ra kế hoạch để giải quyết chúng.
Một mô hình thế giới bao phủ môi trường: Đây là cơ chế cho phép thực thể thực hiện các suy luận nhanh với độ chính xác hợp lý, tương tự như "trực giác" hoặc "suy nghĩ nhanh" (suy nghĩ hệ thống 1) của con người.

Xây dựng mô hình thế giới và cải thiện tính chắc chắn

Chúng ta đang xây dựng các mô hình thế giới với các Transformer tự hồi quy, cùng kiến trúc mà chúng ta đã sử dụng gần đây, đặc biệt là các mô hình Omni. Mức độ vững chắc của chúng vẫn còn là vấn đề tranh cãi, với các vấn đề như ảo giác và các vấn đề khác. Tuy nhiên, tin tốt là theo kinh nghiệm của tác giả, quy mô cải thiện tính vững chắc.

Nhân loại hiện đang đổ vốn vào việc mở rộng quy mô các mô hình tự hồi quy. Microsoft đang đổ nhiều vốn vào Dự án Stargate phối hợp với OpenAI, và Sam Altman đang tìm kiếm 7 nghìn tỷ đô la vốn (mặc dù đây có thể là một tiêu đề câu khách).

Những người hoài nghi, Transformers và con đường đến AGI

Mặc dù các nhà phê bình LLM như Yan LeCun nói rằng chúng ta vẫn chưa đạt được trí thông minh của một con mèo, tác giả lập luận rằng LLM có thể học được kiến thức đó nếu được tự cải thiện. Ông tin rằng điều này có thể thực hiện được với Transformer và các thành phần đúng.

Tác giả rất tự tin rằng việc đạt được "suy nghĩ hệ thống 2" trong khuôn khổ Transformer là khả thi với công nghệ và khả năng tính toán hiện có. Ông dự đoán chúng ta sẽ có thể xây dựng một cơ chế để thực hiện suy nghĩ hệ thống 2 hiệu quả trong vòng 2-3 năm tới, đây sẽ là một thành phần then chốt để xây dựng một tác nhân thông minh tổng quát.

Tầm quan trọng của Hệ thống 2 Suy nghĩ

Về vấn đề thể hiện, tác giả cũng rất lạc quan về các tiến bộ gần đây. Ông nhận thấy sự hội tụ đang diễn ra giữa các lĩnh vực robot và các mô hình ngôn ngữ lớn, có thể dẫn đến các minh họa ấn tượng trong vòng 1-2 năm tới.

Tóm lại, tác giả tin rằng chúng ta đã giải quyết được vấn đề xây dựng các mô hình thế giới, có 2-3 năm để giải quyết suy nghĩ hệ thống 2, và 1-2 năm để giải quyết vấn đề thể hiện. Một khi các thành phần then chốt này được đặt vào đúng vị trí, việc tích hợp chúng vào thuật toán chu kỳ mà ông mô tả có thể mất thêm 1-2 năm nữa. Ước tính hiện tại của ông về AGI là 3-5 năm, nghiêng về 3 năm đối với một tác nhân thông minh tổng quát có thể hiện.

Hiện thể hóa và sự hội tụ của Robotics và Mô hình Ngôn ngữ

Tác giả nhấn mạnh vai trò then chốt của "suy nghĩ hệ thống 2" trong việc xây dựng các tác nhân thông minh tổng quát. Suy nghĩ hệ thống 2 đề cập đến cơ chế thực hiện sự phản ánh sâu sắc và suy luận về các chủ đề tùy ý, trái ngược với "suy nghĩ hệ thống 1" trực giác hơn dựa trên các phản ứng tự động nhanh chóng.

Tác giả cho rằng để một tác nhân trở nên thông minh tổng quát, nó cần có cách tương tác và quan sát môi trường (thể hiện), một mô hình thế giới vững chắc bao phủ môi trường (trực giác/suy nghĩ hệ thống 1) và một cơ chế để suy nghĩ sâu sắc và lập luận (suy nghĩ hệ thống 2).

Các dòng thời gian lạc quan của Nhà nghiên cứu về AGI

Tác giả bày tỏ sự lạc quan về các tiến bộ gần đây trong việc thể hiện các hệ thống trí tuệ nhân tạo. Ông nhận thấy sự hội tụ đang diễn ra giữa các lĩnh vực robot và các mô hình ngôn ngữ lớn (LLM).

Tác giả nhấn mạnh các minh họa ấn tượng gần đây, chẳng hạn như robot Figure kết hợp kiến thức của GPT-4 với các chuyển động vật lý lưu loát. Ông cũng đề cập đến Unitary H1 vừa được phát hành, một tác nhân AI có dạng hình ảnh giống robot của Boston Dynamics.

Tác giả giải thích rằng các mô hình đa phương thức lớn có thể ánh xạ các đầu vào cảm biến tùy ý thành các lệnh có thể gửi đến các hệ thống robot tinh vi. Điều này cho phép triển khai các hệ thống có thể thực hiện các chuỗi hành động liên tục trong môi trường và quan sát, hiểu kết quả.

Câu hỏi thường gặp

Định nghĩa về trí thông minh tổng quát theo bài đăng trên blog là gì?

Theo tác giả, ông ước tính chúng ta sẽ đạt được AGI vào khi nào?

Theo tác giả, ba thành phần then chốt cần thiết để xây dựng một tác nhân thông minh tổng quát là gì?

Tác giả nói gì về tiến bộ cần thiết trong vòng 1-2 năm tới đối với hiện thân và tư duy hệ thống 2?

Tác giả phản hồi như thế nào về lời phê bình của nhà hoài nghi AI Yan LeCun rằng các mô hình ngôn ngữ hiện tại không thông minh bằng một con mèo?

Tạo bạn gái AI của bạn

Xây dựng người bạn đồng hành lý tưởng của bạn với AI Girlfriend Builder của chúng tôi