إطلاق قوة البرمجة: AutoCoder LLM يتفوق على GPT-4 لإتقان البرمجة المفتوحة المصدر

اكتشف كيف تجاوز AutoCoder، وهو LLM مفتوح المصدر للترميز، GPT-4 في مؤشر تقييم البشر. تعرف على مفسر الرمز المتعدد الاستخدامات الخاص به والإمكانات التي قد تؤدي إلى ثورة في إتقان الترميز مفتوحة المصدر.

١٦ فبراير ٢٠٢٥

party-gif

اكتشف قوة AutoCoder، وهو LLM مفتوح المصدر للترميز يتفوق على GPT-4 في مؤشر تقييم البشر. مع مفسر الرمز المتعدد الاستخدامات وقدرته على التعامل مع مجموعة أوسع من المهام، يوفر AutoCoder حلاً مغيرًا للعبة لاحتياجات الترميز الخاصة بك. استكشف فوائد هذه التقنية الحديثة وافتح آفاقًا جديدة لمشاريعك.

قدرات AutoCoder: تجاوز GPT-4 في مقاييس البرمجة

AutoCoder هو نموذج لغة كبير جديد أحدث ضجة في مجتمع الذكاء الاصطناعي. تفوق هذا النموذج على أداء GPT-4 Turbo (إصدار أبريل 2024) وكذلك GPT-4 Omni الأحدث على مقياس الأداء البشري المرموق، وهو إنجاز مذهل.

ما يميز AutoCoder هو مفسر الرمز المتنوع. على عكس GPT-4 Turbo و Omni، والتي تقتصر على الحزم المضمنة، يمكن لـ AutoCoder تثبيت الحزم الخارجية تلقائيًا حسب الحاجة، مما يوسع نطاق المهام التي يمكنه التعامل معها بشكل كبير. تتيح هذه الميزة لـ AutoCoder التعامل مع مجموعة أوسع من التحديات البرمجية.

الاختلاف الرئيسي الآخر هو طريقة استدعاء مفسر الرمز. مع AutoCoder، يتم استخدام المفسر بشكل انتقائي، فقط عندما يحتاج المستخدم إلى التحقق من الرمز. في المقابل، يقوم مفسر الرمز المفتوح في GPT-4 Turbo بتشغيل جميع رموز Python المولدة بشكل افتراضي، دون انتظار إدخال المستخدم أو التحقق من الرمز.

معمارية تعليم وتعلم ذاتي لـ AI EV Instruct

يُقسم معمارية AI EV Instruct إلى مرحلتين رئيسيتين: مرحلة التدريس ومرحلة التعلم الذاتي.

في مرحلة التدريس، يتعلم النموذج بشكل أساسي من خلال استخلاص المعرفة من نموذج المعلم، مثل GPT-4 Turbo أو DeBERTa. تتضمن هذه المرحلة أربع خطوات رئيسية:

  1. التهيئة: يقوم النموذج بتهيئة الأدوار ورسائل الحوار ومفسر الرمز.
  2. حل المشكلة: يصف النموذج المشكلات ويقدم الحلول، مع إرفاق رسائل الحوار بوصف المشكلة.
  3. ردود الفعل على التنفيذ: يتعامل النموذج مع الأخطاء، ويقدم وصفات باللغة الطبيعية، ويعدل نموذج الرمز.
  4. الإنهاء: إذا تم تنفيذ البرنامج بنجاح، يتم إرفاق رسائل الحوار لإكمال تحليل إدخال البيانات الواحد، وينتقل العملية إلى مرحلة تقييم البيانات.

مرحلة التعلم الذاتي هي حيث يحل النموذج الطالب محل النموذج الأصلي ويتولى أدوار كل من السائل والبرمجي. يكمل النموذج الطالب عملية ردود الفعل على التنفيذ بشكل مستقل، مما يسمح له بالاستمرار في التعلم وتحسين أدائه دون الاعتماد على نموذج المعلم.

مقارنة مجموعة بيانات AutoCoder مع نماذج لغة أخرى متخصصة في البرمجة

يتمتع AutoCoder، وهو نموذج لغة كبير جديد مركز على تعزيز الرمز، بمجموعة بيانات أكثر قوة بكثير مقارنة بنماذج التشفير المتطورة الأخرى. فيما يلي تفاصيل الاختلافات الرئيسية:

  • مجموعة بيانات AutoCoder: 169 ألف عينة بيانات، 241 جولة من الحوار، بما في ذلك الوظيفة الرئيسية وتثبيت الحزم وأخطاء تنفيذ الرمز والإصلاحات. كما تتضمن اختبارات وحدة لتحسين الدقة.

  • Magic Coder OSS Instruct: 75 ألف عينة بيانات، 75 جولة من الحوار.

  • Magic Coder EAL Instruct: فقط 1,111 عينة بيانات، 111 جولة من الحوار.

مقارنة AutoCoder مع أحدث النماذج

تجاوز AutoCoder، وهو نموذج لغة كبير جديد مركز على توليد وتفسير الرمز، أداء GPT-4 Turbo (إصدار أبريل 2024) و GPT-4 Omni على مقياس الأداء البشري. هذا إنجاز ملحوظ، حيث كانت هذه النماذج تُعتبر سابقًا من أفضل النماذج في مجال المهام المتعلقة بالرمز.

أحد المزايا الرئيسية لـ AutoCoder هو قدرته على الوصول إلى واستخدام المكتبات الخارجية، على عكس نموذج GPT-4 Turbo المقيد. توفر هذه الوظيفية الموسعة لـ AutoCoder القدرة على التعامل مع مجموعة أوسع من المهام والتطبيقات. بالإضافة إلى ذلك، تم تصميم نموذج AutoCoder لاستدعاء مفسر الرمز بشكل انتقائي بناءً على متطلبات المستخدم، بدلاً من تشغيل جميع الرموز المولدة بشكل افتراضي مثل مفسر الرمز المفتوح.

من حيث بيانات التدريب، يتباهى AutoCoder بمجموعة بيانات أكبر بكثير مقارنة بالنماذج الأخرى المركزة على مهام البرمجة. تحتوي مجموعة بيانات AutoCoder على 169,000 عينة بيانات مع 241 جولة من الحوار، بما في ذلك الوظيفة الرئيسية وتثبيت الحزم وأخطاء تنفيذ الرمز والإصلاحات. يسمح هذا المجموعة البيانات الشاملة للنموذج بالتعلم وتحسين قدراته على توليد وتفسير الرمز بشكل أكثر فعالية.

الخاتمة

يُعد إدخال AutoCoder، وهو نموذج لغة كبير جديد يتفوق على GPT-4 Turbo و GPT-4 Omni على مقياس الأداء البشري، تطورًا مهمًا في مجال تفسير وتوليد الرمز. يقدم هذا النموذج المفتوح المصدر، والذي يستند إلى معمارية DeepSE coder، مفسر رمز أكثر تنوعًا وقدرة مقارنة بسابقيه.

إحدى الميزات الرئيسية لـ AutoCoder هي قدرته على تثبيت الحزم الخارجية تلقائيًا، مما يوسع نطاق قدراته على تفسير الرمز. هذه ميزة كبيرة مقارنة بقيود GPT-4 Turbo، والذي يقتصر على الحزم المضمنة فقط. الاستخدام الانتقائي لمفسر الرمز، اعتمادًا على متطلبات المستخدم، هو جانب آخر ملحوظ في AutoCoder.

ساهمت بيانات تدريب النموذج، والتي تتضمن مجموعة بيانات حوار متعدد الجولات ونظام لدمج تفاعلات الوكيل مع التحقق من تنفيذ الرمز الخارجي، في أدائه المвпечатляющий. يسلط المقارنة بين مجموعة بيانات AutoCoder والنماذج المتطورة الأخرى، مثل LLaMA 3 400B و GPT-4 Omni Ultra، الضوء على مزاياه.

التعليمات