فاي-3: نموذج اللغة الصغير ولكن القوي الخاص بمايكروسوفت يتفوق على Llama 3 و Mixtal

فاي-3: نموذج اللغة الصغير ولكن القوي لشركة مايكروسوفت يتفوق على Llama 3 و Mixtal. اكتشف كيف يتفوق هذا النموذج ذو 3.8 مليار معلمة على المعايير المرجعية، ويعمل على الأجهزة المحمولة، ويوفر حالات استخدام متنوعة تتجاوز البرمجة المعقدة.

٢٣ فبراير ٢٠٢٥

party-gif

اكتشف قوة Phi-3، أحدث وأصغر نموذج لغوي من مايكروسوفت الذي يتفوق على نماذج أكبر مثل Llama 3 و Mixtral. هذا الحل الذكائي المدمج والعالي الأداء يوفر تطبيقات متنوعة، من الإجابة على الأسئلة إلى المهام القائمة على المعرفة، مما يجعله لاعبًا رئيسيًا في عالم معالجة اللغة الطبيعية.

صغير ولكن قوي: تقديم طرازات Phi-3

شهد مجال الذكاء الاصطناعي تطورات مثيرة للاهتمام، وكان هذا الأسبوع بشكل خاص ملحوظًا. لقد شهدنا إصدار LLaMA 3، أفضل نموذج لغة كبير مفتوح المصدر حتى الآن، وها نحن الآن نشهد تقديم نماذج Phi-3 من فريق Microsoft AI.

Phi-3 هو الإصدار الثالث من عائلة Phi، مجموعة من النماذج الصغيرة الجديدة التي تستفيد من نفس تقنيات التدريب المستخدمة في Phi-2. الهدف هو إنتاج نماذج صغيرة الحجم ولكن عالية الأداء. مع إصدار Phi-3، قدمت Microsoft أربعة نماذج جديدة تحت هذا المظلة:

  1. Phi-3 Mini: نموذج له نافذة سياق 4K.
  2. Phi-3 Mini 128K: نموذج أكثر إثارة للإعجاب بنافذة سياق ضخمة تبلغ 128K، على الرغم من حجمه الصغير البالغ 3.8 مليار معلمة فقط.
  3. Phi-3 Small: نموذج بمعلمات 7 مليار يتفوق على نماذج مثل Megatron و LLaMA 3.
  4. Phi-3 Medium: نموذج بمعلمات 14 مليار يتفوق على أداء GPT-3.5 و Megatron على مختلف المعايير، بما في ذلك MML Benchmark، والذي يقيم المهام متعددة المجالات.

الميزة البارزة لهذه النماذج Phi-3 هي كفاءتها واستثنائية أدائها، حتى على الأجهزة المحمولة. يمكن لنموذج Phi-3 Mini المكمم بـ 4 بت توليد أكثر من 12 رمزًا في الثانية على iPhone 14، مما يوضح قدرته على العمل بشكل أصلي على مجموعة واسعة من الأجهزة.

المواصفات الفنية لطرازات Phi-3

تتكون عائلة نماذج Phi-3 من أربعة نماذج مختلفة، لكل منها مواصفاته الفنية الخاصة:

  1. Phi-3 Mini:

    • يعتمد على هندسة مفكك المحول
    • طول السياق الافتراضي 4,000 رمز
    • متوفر أيضًا بإصدار سياق أطول، Phi-3 Mini 128k، والذي يزيد طول السياق إلى 128,000 رمز باستخدام طريقة Long Range
    • يشترك في نفس هيكل الكتلة ومحلل الرموز مع نموذج Llama 2
  2. Phi-3 Small:

    • نموذج بمعلمات 7 مليار
    • يستفيد من نفس محلل الرموز والهندسة مثل نماذج Phi-3 Mini
    • طول السياق الافتراضي 8,000 رمز
  3. Phi-3 Medium:

    • نموذج بمعلمات 14 مليار
    • يحافظ على نفس محلل الرموز والهندسة مثل نموذج Phi-3 Mini
    • تم تدريبه على مجموعة بيانات أكبر قليلاً مقارنة بالنماذج الأصغر
  4. Phi-3 Mini (4-bit Quantized):

    • إصدار مكمم من نموذج Phi-3 Mini
    • مصمم للنشر الفعال على الأجهزة المحمولة، مثل iPhone 14 مع رقاقة A16 Bionic
    • قادر على توليد أكثر من 12 رمزًا في الثانية على iPhone 14

تقييم طرازات Phi-3: التفوق على المنافسة

كان إصدار نماذج Phi-3 من فريق Microsoft AI تطورًا مهمًا في مجال الذكاء الاصطناعي. هذه النماذج، وهي الإصدار الثالث من عائلة Phi، تستخدم نفس تقنيات التدريب المستخدمة في Phi-2 لإنتاج نماذج لغة صغيرة الحجم ولكن عالية الأداء.

يتضمن طراز Phi-3 أربعة نماذج مختلفة، لكل منها قدراته وخصائص الأداء الفريدة الخاصة به:

  1. Phi-3 Mini: يتميز هذا النموذج بنافذة سياق 4K، مما يُظهر كفاءة استثنائية في حجم صغير.
  2. Phi-3 Mini 128K: متجاوزًا الحدود، يتميز هذا النموذج بنافذة سياق ضخمة تبلغ 128K، وهو إنجاز مذهل لنموذج بهذا الحجم.
  3. Phi-3 Small: هذا النموذج المعروض مسبقًا قد تفوق بالفعل على أداء نماذج أكبر مثل Megatron و LLaMA 3.
  4. Phi-3 Medium: أكبر نماذج Phi-3، هذا النموذج البالغ 14 مليار معلمة يتفوق حتى على GPT-3.5 و Megatron 8.7B على مختلف المعايير.

الوصول إلى طرازات Phi-3 ونشرها

يمكن الوصول إلى نماذج Phi-3 ونشرها بعدة طرق مختلفة:

  1. باستخدام Hugging Face: جميع نماذج Phi-3 الأربعة متوفرة على Hugging Face Hub. يمكنك استخدام مكتبة Hugging Face Transformers لتحميل واستخدام هذه النماذج في تطبيقاتك بلغة Python.

  2. التثبيت المحلي باستخدام LLM Studio: يمكنك أيضًا تثبيت نماذج Phi-3 محليًا باستخدام LLM Studio. ببساطة انسخ بطاقة النموذج، وافتح LLM Studio، وألصق بطاقة النموذج في علامة التبويب البحث. ثم انقر على زر التثبيت لتنزيل وإعداد النموذج على جهازك المحلي.

  3. النشر على الأجهزة المحمولة: إحدى المزايا الرئيسية لنماذج Phi-3 هي قدرتها على العمل بكفاءة على الأجهزة المحمولة. أظهر نموذج Phi-3 Mini المكمم بـ 4 بت قدرته على توليد أكثر من 12 رمزًا في الثانية على iPhone 14 مع رقاقة A16 Bionic.

التطبيقات العملية: الاستفادة من Phi-3 لتلبية احتياجاتك

يعد نموذج اللغة Phi-3 من Microsoft AI أداة قوية يمكن الاستفادة منها في مجموعة متنوعة من الحالات الاستخدامية. على الرغم من حجمه الصغير، أظهر Phi-3 أداءً مвпечатляющًا على مجموعة متنوعة من المعايير، متفوقًا غالبًا على نماذج أكبر مثل GPT-3.

إحدى نقاط القوة الرئيسية لـ Phi-3 هي كفاءته، مما يسمح له بالنشر على الأجهزة المحمولة وغيرها من البيئات محدودة الموارد. هذا يجعله مناسبًا بشكل جيد للتطبيقات التي تتطلب استجابات سريعة وفورية، مثل المساعدات الافتراضية أو الدردشات.

بالإضافة إلى ذلك، فإن أداء النموذج القوي على المهام القائمة على المعرفة يجعله أصلاً قيمًا لأنظمة الإجابة على الأسئلة وتلخيص المحتوى واسترجاع المعلومات. يمكن للمطورين دمج Phi-3 في تطبيقاتهم لتزويد المستخدمين بردود موجزة ودقيقة على استفساراتهم.

القيود والاعتبارات: عندما لا يكون Phi-3 هو الخيار الأفضل

على الرغم من أن نموذج Phi-3 قد أظهر أداءً مвпечатляющًا على مجموعة متنوعة من المعايير، من المهم أن نأخذ في الاعتبار القيود والحالات الاستخدامية التي قد لا يكون فيها الخيار الأمثل. كما ذُكر في الفيديو، تم تصميم نموذج Phi-3 بشكل أساسي للمهام القائمة على المعرفة العامة والإجابة على الأسئلة، وليس للتوليد المعقد للرموز أو حل المشكلات.

بالنسبة للمهام التي تتطلب استدلالاً أكثر تقدمًا، مثل بناء تطبيقات برمجية معقدة أو حل مشكلات معقدة، قد لا يكون نموذج Phi-3 هو الخيار الأمثل. في مثل هذه الحالات، قد تكون نماذج اللغة الأكبر والأكثر تخصصًا، مثل GPT-3 أو LLaMA، أكثر ملاءمة لأنها تم تدريبها على مجموعة بيانات أوسع وتستطيع التعامل مع المهام الأكثر تعقيدًا.

بالإضافة إلى ذلك، قد يتطلب نموذج Phi-3، على الرغم من حجمه الصغير، موارد حسابية كبيرة للنشر، خاصة على الأجهزة المحمولة أو البيئات محدودة الموارد. في مثل هذه السيناريوهات، قد تكون النماذج الأصغر مثل Phi-3 Mini أو Phi-3 Small أكثر ملاءمة، حيث يمكنها توفير توازن بين الأداء والكفاءة.

الخاتمة

إن إصدار عائلة نماذج 5-3 من فريق Microsoft AI هو تطور مهم في عالم نماذج اللغة الكبيرة. تقدم هذه النماذج المدمجة ولكن عالية الأداء قدرات مвпечатляющة، متفوقة غالبًا على نماذج أكبر مثل GPT-3.5 و Megatron على مختلف المعايير.

يُعد نموذج 5-3 Mini، مع نافذة سياق 4K وعدد معلمات 3.8 مليار، ملاحظًا بشكل خاص، مما يُظهر إمكانات نشر نماذج لغة قوية على الأجهزة المحمولة. كما أن الإصدار الممتد 128K من سياق 5-3 Mini هو أيضًا إنجاز مذهل، مما يُظهر التقدم في هندسة النماذج وتقنيات التدريب.

بينما لا تم تصميم نماذج 5-3 بشكل أساسي للترميز المعقد أو مهام الاستدلال، فهي تتفوق على الاستفسارات القائمة على المعرفة العامة ويمكن دمجها بفعالية في أنظمة الإجابة على الأسئلة أو ربطها بخوارزميات مثل RAG. تجعل كفاءتها وأدائها منها إضافة قيمة إلى نظام الذكاء الاصطناعي.

التعليمات