الذكاء الاصطناعي العام أقرب مما نعتقد: تنبؤ جريء لباحث في OpenAI بمدة 3-5 سنوات

استكشف توقع جريء لباحث في OpenAI للفترة الزمنية من 3 إلى 5 سنوات للذكاء الاصطناعي العام (AGI). انغمس في المكونات الرئيسية للذكاء العام والرؤى حول التقدم في نماذج العالم والتفكير النظام 2 والتجسيد. اكتشف التقارب المحتمل بين الروبوتات ونماذج اللغة الكبيرة التي تشير إلى مستقبل AGI مثير للاهتمام.

٢٠ فبراير ٢٠٢٥

party-gif

اكتشف الرؤى المذهلة من باحث في OpenAI حول التقدم السريع في الذكاء الاصطناعي العام (AGI) وكيف قد نكون أقرب إلى هذا الإنجاز مما تعتقد. استكشف المكونات الرئيسية اللازمة لبناء وكيل ذكي بشكل عام وتعرف على الجدول الزمني المحتمل لتحقيق AGI في السنوات المقبلة.

المكونات الرئيسية لوكيل ذكي عام

تتطلب الكيانات ذات الذكاء العام بشكل عام تركيبة من ثلاثة مكونات رئيسية:

  1. طريقة للتفاعل مع بيئة معقدة ورصدها: وهذا يعني عادةً التجسيد - القدرة على إدراك العالم الطبيعي والتفاعل معه باستخدام مختلف المدخلات الحسية مثل اللمس والشم والرؤية، وما إلى ذلك. وهذا يسمح للكيان ببناء نموذج عالمي قوي يغطي البيئة.

  2. آلية لإجراء تأمل عميق في مواضيع متنوعة: وهذه هي القدرة على التفكير والتفكير "البطيء" (التفكير في النظام 2)، حيث يمكن للكيان التفكير بعمق في المشكلات ووضع خطط لحلها.

  3. نموذج عالمي يغطي البيئة: وهذه هي الآلية التي تسمح للكيان بإجراء استنتاجات سريعة بدقة معقولة، تشبه "الحدس" أو "التفكير السريع" (التفكير في النظام 1) لدى البشر.

بهذه المكونات الثلاثة، يمكن "بذر" الكيان بأهداف، واستخدام تفكيره في النظام 2 بالتزامن مع نموذجه العالمي لإبداع طرق لتحسين تلك الأهداف. ثم يمكنه اتخاذ إجراءات، ورصد النتائج، وتحديث نموذجه العالمي وفقًا لذلك. ويمكن تكرار هذه الدورة على فترات طويلة، مما يسمح للكيان بتنفيذ وتحسين أي هدف معين بشكل متماسك.

المفتاح هو أن الكيان لا يحتاج بالضرورة إلى القدرة على تحقيق أهداف تعسفية، ولكن إلى القابلية للتكيف والتماسك للعمل باستمرار نحو هدف واحد على مر الوقت. وهذا هو ما يحدد نظام ذكاء عام قادر حقًا.

بناء نماذج عالمية وتحسين المتانة

نحن بالفعل نبني نماذج عالمية باستخدام المحولات الاستقرائية التلقائية، وهي نفس المعمارية التي كنا نستخدمها مؤخرًا، وخاصة من نوع Omni. مدى قوتها محل نقاش، مع وجود مشكلات مثل الهلوسات وغيرها. ومع ذلك، الخبر السار هو أنه بحسب خبرة المؤلف، فإن الزيادة في الحجم تحسن من القوة.

يصب البشر حاليًا رأس المال في تطوير نماذج استقرائية تلقائية. تصب Microsoft الكثير من رأس المال في مشروع Stargate بالتعاون مع OpenAI، ويسعى Sam Altman للحصول على 7 تريليون دولار في رأس المال (على الرغم من أن هذا ربما يكون عنوان جذب للنقر).

ما دام الحجم في ازدياد، فإن قوة هذه النماذج العالمية ينبغي أن تتحسن.

يعتقد المؤلف أن النماذج العالمية التي لدينا الآن كافية لبناء عامل ذكاء عام. كما يعتقد أيضًا أن القوة يمكن تحسينها بشكل أكبر من خلال تفاعل التفكير في النظام 2 (التفكير العميق والمتعمد) ومراقبة العالم الحقيقي - وهو نموذج لم يُرَ بعد في الذكاء الاصطناعي، ولكنه آلية رئيسية لتحسين القوة.

المشككون والمحولات ومسار الذكاء الاصطناعي العام

بينما يقول منتقدو LLM مثل Yan LeCun إننا لم نحقق بعد ذكاء القطة، يجادل المؤلف بأن LLM يمكنها تعلم هذه المعرفة إذا أُتيحت لها القدرة على التحسين الذاتي. ويعتقد أنه من الممكن تحقيق ذلك باستخدام المحولات والمكونات الصحيحة.

يشعر المؤلف بثقة كبيرة في إمكانية تحقيق التفكير في النظام 2 ضمن نموذج المحول مع التكنولوجيا والحوسبة المتاحة حاليًا. ويتوقع أن نرى تقدمًا كبيرًا في هذا المجال خلال السنوات الـ 2-3 المقبلة، وهو مكون رئيسي في بناء عامل ذكاء عام.

وبالمثل، يشعر المؤلف بتفاؤل كبير بشأن التطورات القريبة في مجال التجسيد. هناك تقارب يحدث بين مجالي الروبوتات ونماذج اللغة الكبيرة، مما قد يؤدي إلى عروض مвпечатляющие في غضون السنة أو السنتين المقبلتين.

أهمية التفكير في النظام 2

يؤكد المؤلف على الدور الحاسم للـ "التفكير في النظام 2" في بناء عوامل ذكاء عام. ويشير التفكير في النظام 2 إلى الآلية لإجراء تأمل عميق والتفكير في مواضيع متنوعة، على عكس "التفكير في النظام 1" الأكثر حدسية والتي تعتمد على استجابات آلية سريعة.

يجادل المؤلف أنه من أجل أن يكون الوكيل ذكيًا بشكل عام، فإنه بحاجة إلى طريقة للتفاعل مع البيئة ورصدها (التجسيد)، ونموذج عالمي قوي يغطي البيئة (الحدس/التفكير في النظام 1)، وآلية للتأمل العميق والتفكير (التفكير في النظام 2).

على وجه التحديد، يقول المؤلف إنه مع النماذج العالمية المتاحة حاليًا، يشك أنها كافية لبناء عامل ذكاء عام. ومع ذلك، فإن القطعة المفقودة الرئيسية هي قدرة التفكير في النظام 2. ويشعر المؤلف بالثقة في إمكانية تحقيق التفكير الفعال في النظام 2 ضمن نموذج المحول، مع التكنولوجيا والحوسبة المتاحة حاليًا.

التجسيد وتقارب الروبوتات ونماذج اللغة

يعبر المؤلف عن تفاؤله بشأن التطورات القريبة في مجال تجسيد أنظمة الذكاء الاصطناعي. ويلاحظ أن هناك تقاربًا يحدث بين مجالي الروبوتات ونماذج اللغة الكبيرة (LLM).

يسلط المؤلف الضوء على العروض المвпечатляющие الأخيرة، مثل روبوت Figure الذي جمع بين معرفة GPT-4 والحركات البدنية السلسة. كما يذكر Unitary H1 الذي تم إصداره مؤخرًا، وهو عامل ذكاء اصطناعي له شكل شبيه بروبوت Boston Dynamics.

يشرح المؤلف أن النماذج الشاملة متعددة الأوضاع يمكنها تحويل المدخلات الحسية التعسفية إلى أوامر يمكن إرسالها إلى أنظمة روبوتية متطورة. وهذا يسمح بنشر أنظمة يمكنها تنفيذ سلاسل متماسكة من الإجراءات في البيئة ورصد النتائج وفهمها.

يلخص المؤلف أنه قد تم حل مشكلة بناء النماذج العالمية بالفعل، وأنه سيستغرق 2-3 سنوات لتحقيق التفكير الفعال في النظام 2 (التفكير طويل المدى). وفي الوقت نفسه، يتوقع تقدمًا في مجال التجسيد على مدى 1-2 سنة. وبمجرد وجود هذه المكونات الرئيسية، سيستغرق دمجها في الخوارزمية الدورية المذكورة سابقًا سنة إضافية أو اثنتين.

جداول زمنية متفائلة للباحث للذكاء الاصطناعي العام

يعتقد الباحث أن المكونات الرئيسية لبناء عامل ذكاء عام باتت في متناول اليد. ويحدد تعريفًا ثلاثيًا للذكاء العام:

  1. طريقة للتفاعل مع بيئة معقدة ورصدها، عادةً من خلال التجسيد والقدرة على إدراك العالم الطبيعي والتفاعل معه.
  2. نموذج عالمي قوي يغطي البيئة، مما يسمح بإجراء استنتاجات سريعة ودقيقة - ما يشير إليه البشر بـ "الحدس" أو "التفكير في النظام 1".
  3. آلية لإجراء تأمل عميق والتفكير في مواضيع متنوعة - "التفكير في النظام 2" أو التفكير المتعمد والواعي.

يجادل الباحث أنه بهذه المكونات الثلاثة، من الممكن بناء عامل ذكاء عام يمكنه تنفيذ دورة متماسكة من التخطيط والعمل والملاحظة وتحديث نموذجه العالمي لتحسين الأهداف المحددة.

ويعتقد أن النماذج العالمية المبنية باستخدام نماذج اللغة الكبيرة الحالية كافية بالفعل لبناء مثل هذا العامل ذي الذكاء العام. والتحديات الرئيسية المتبقية هي:

  1. تطوير قدرات "التفكير في النظام 2" الفعالة ضمن نموذج المحول. ويشعر الباحث بالثقة في تحقيق ذلك خلال السنوات الـ 2-3 المقبلة.
  2. دمج التفاعل المتجسد مع العالم المادي. ويتوقع تقدمًا كبيرًا في هذا المجال خلال السنة أو السنتين المقبلتين.

من خلال الجمع بين هذه التطورات، يقدر الباحث أننا قد نرى ظهور "عامل ذكاء عام متجسد" الذي سيعتبره شخصيًا ذكاءً اصطناعيًا عامًا في غضون 3-5 سنوات. ويميل إلى الخط الزمني البالغ 3 سنوات، على الرغم من أنه يلاحظ أنه قد يستغرق وقتًا إضافيًا لإقناع الأصوات الأكثر تشككًا في المجال.

التعليمات