افتح قدرات الذكاء الاصطناعي القوية مع Qwen-Agent: استدعاء الوظيفة، مفسر الرمز، و RAG
افتح قدرات الذكاء الاصطناعي القوية مع Qwen-Agent ، إطار عمل متعدد الوكلاء مفتوح المصدر يدمج Qwen 2 LLM لاستدعاء الوظائف وتفسير الرموز والاسترجاع المعزز. اكتشف كيف يتفوق على RAG والنماذج الأصلية طويلة السياق.
١٦ فبراير ٢٠٢٥

افتح قوة الذكاء الاصطناعي مع Qwen-Agent ، إطار عمل متعدد الوكلاء متطور يدمج بسلاسة نموذج اللغة الكبير المتقدم Qwen 2. اكتشف كيف يمكن أن ترفع قدرات هذا الإطار ، بما في ذلك استدعاء الوظائف وتفسير الرمز والتوليد المعزز بالاسترجاع ، مشاريعك المدفوعة بالذكاء الاصطناعي إلى آفاق جديدة.
إطار عمل قوي متعدد الوكلاء: استدعاء الوظيفة، مفسر الرمز، و RAG
توليد البيانات لتدريب نماذج Quin الجديدة للسياق الطويل
بناء الوكيل: ثلاثة مستويات من التعقيد
الاسترجاع المعزز بالتوليد (RAG)
القراءة قطعة بقطعة
التفكير خطوة بخطوة مع وكلاء استدعاء الأدوات
التجارب وتحسينات الأداء
البدء مع وكيل Quin
إطار عمل قوي متعدد الوكلاء: استدعاء الوظيفة، مفسر الرمز، و RAG
إطار عمل قوي متعدد الوكلاء: استدعاء الوظيفة، مفسر الرمز، و RAG
إن وكيل Quen هو إطار عمل وكيل ذكاء اصطناعي جديد ومتقدم مبني على نموذج اللغة الكبير Quen 2. إنه يدمج العديد من القدرات القوية، بما في ذلك استدعاء الوظائف، ومفسر الرموز، والتوليد المعزز بالاسترجاع (RAG)، وامتداد Chrome.
يهدف هذا الإطار إلى إنشاء وكلاء ذكاء اصطناعي متطورين قادرين على تفوق أنظمة الوكلاء المتعددة الأخرى. إحدى الميزات الرئيسية لوكيل Quen هي قدرته على التعامل مع المهام المعقدة ذات الحجم السياقي الكبير. تمكن الإطار من فهم المستندات التي تصل إلى مليون رمز، متفوقًا على أداء RAG والنماذج الطويلة السياق الأصلية.
يستخدم وكيل Quen نهجًا رباعي الخطوات لتعميم نموذج اللغة الكبير من حجم سياق 8K إلى سياق مليون رمز:
- النموذج الأولي: يبدأ الإطار بنموذج دردشة ضعيف ذي سياق 8K.
- تطوير الوكيل: يتم استخدام النموذج لبناء وكيل نسبيًا قوي قادر على التعامل مع سياق مليون رمز.
- تركيب البيانات: يتم استخدام الوكيل لتركيب بيانات التدريب عالية الجودة، مع ترشيح آلي لضمان الجودة.
- ضبط النموذج: يتم استخدام البيانات التركيبية لضبط نموذج مسبق التدريب، مما ينتج عنه دردشة بوت قوية ذات سياق مليون رمز.
تنظم قدرات وكيل Quen في ثلاثة مستويات من التعقيد:
- التوليد المعزز بالاسترجاع (RAG): هذا نهج بسيط يعالج سياقات مليون رمز، مع تقسيمها إلى قطع أقصر واحتفاظ بأكثرها صلة ضمن السياق 8K.
- القراءة قطعة بقطعة: هذه استراتيجية قوة بروتية تفحص كل قطعة 512 رمز للصلة بالاستفسار، وتسترجع أكثر القطع صلة، وتولد الإجابة النهائية.
- الاستدلال خطوة بخطوة: هذا النهج يستخدم وكلاء الاستدلال المتعدد الخطوات واستدعاء الأدوات لإجابة الأسئلة المعقدة التي تتطلب فهمًا عبر خطوات متعددة.
إن الأداء المвпечатляющий لوكيل Quen وقدرته على التعامل مع المهام ذات السياق الطويل يجعله إطار عمل وكيل ذكاء اصطناعي قوي مفتوح المصدر. يمكن للمطورين البدء باستخدام وكيل Quen من خلال تثبيت الإطار من موقع Pi والاتباع الدروس المتاحة لنشر وكلائهم الخاصين واستخدام نموذج اللغة الكبير Quen 2.
توليد البيانات لتدريب نماذج Quin الجديدة للسياق الطويل
توليد البيانات لتدريب نماذج Quin الجديدة للسياق الطويل
تم استخدام وكيل Quin لتوليد بيانات لتدريب نماذج Quin طويلة السياق جديدة. هذا إنجاز كبير، حيث كان إعداد بيانات ضبط طويلة بما فيه الكفاية تحديًا في البحث عن نماذج اللغة الكبيرة التي يمكنها معالجة تسلسلات من ملايين الرموز بشكل أصلي.
ينطوي النهج المستخدم بواسطة وكيل Quin على عملية رباعية الخطوات:
-
النموذج الأولي: تبدأ العملية بنموذج دردشة ضعيف ذي سياق 8K كنموذج أولي.
-
تطوير الوكيل: في هذه المرحلة، يتم استخدام وكيل Quin لبناء وكيل نسبيًا قوي قادر على التعامل مع سياق مليون.
-
تركيب البيانات: ثم يتم استخدام الوكيل لتركيب بيانات الضبط، مع ترشيح آلي لضمان الجودة.
-
ضبط النموذج: أخيرًا، يتم استخدام البيانات التركيبية لضبط نموذج مسبق التدريب، مما ينتج عنه دردشة بوت قوية ذات سياق مليون.
يستفيد هذا النهج من قدرات وكيل Quin للتغلب على تحدي إعداد البيانات لتدريب نماذج اللغة الكبيرة ذات السياقات الطويلة. من خلال استخدام الوكيل لتوليد بيانات تركيبية عالية الجودة، تمكن الباحثون من ضبط نموذج قادر على معالجة تسلسلات تصل إلى مليون رمز بفعالية، متفوقًا على النهج التقليدية مثل RAG والنماذج طويلة السياق الأصلية.
يسلط نجاح هذا النهج الضوء على قوة إطار عمل وكيل Quin وقدرته على تمكين تطوير أنظمة الذكاء الاصطناعي المتقدمة التي يمكنها التعامل مع المهام المعقدة والمحتوى طويل الشكل.
بناء الوكيل: ثلاثة مستويات من التعقيد
بناء الوكيل: ثلاثة مستويات من التعقيد
يتكون بناء الوكيل من ثلاثة مستويات من التعقيد، كل منها مبني على السابق:
-
التوليد المعزز بالاسترجاع:
- هذا نهج بسيط يعالج طول سياق مليون.
- يستخدم خوارزمية RAG (التوليد المعزز بالاسترجاع).
- يقسم السياق إلى قطع أقصر، لا يتجاوز كل منها 512 رمز.
- يحتفظ فقط بأكثر القطع صلة ضمن السياق 8K.
- له ثلاث خطوات فرعية:
- فصل التعليمات والمعلومات: يميز بين أجزاء التعليمات وغير التعليمات من استفسار المستخدم.
- استخراج الكلمات الرئيسية: يستنتج الكلمات الرئيسية متعددة اللغات من الجزء المعلوماتي من الاستفسار.
- استرجاع القطع ذات الصلة: يستخدم خوارزمية BM25 لتحديد أكثر القطع صلة.
-
القراءة قطعة بقطعة:
- يعالج هذا النهج قيود نهج RAG، والتي قد تفوت القطع ذات الصلة إذا لم تتطابق مع كلمة رئيسية في الاستفسار.
- يتضمن ثلاث خطوات:
- تقييم الصلة: يفحص نموذج كل قطعة 512 رمز للصلة بالاستفسار.
- استرجاع القطع: يتم استخدام الجمل ذات الصلة لاسترجاع أكثر القطع صلة ضمن حد السياق 8K، باستخدام خوارزمية BM25.
- توليد الإجابة: يتم توليد الإجابة النهائية بناءً على السياق المسترجع، مشابهًا لطريقة RAG.
-
الاستدلال خطوة بخطوة:
- يستخدم هذا النهج للإجابة على الأسئلة المبنية على المستندات، حيث يلزم الاستدلال متعدد الخطوات.
- يستخدم وكلاء استدعاء الأدوات، والتي لديها أنواع متعددة من الأدوات، مثل "اسأل وكيل LV3 سؤالاً"، "أسئلة فرعية"، "تحديث الذاكرة"، وما إلى ذلك.
- يسمح هذا النهج للنموذج بزيادة السياق إلى مليون رمز وتحسين جودة الوظائف المختلفة.
تظهر التجارب أن وكيل Quin قادر على تحسين جودة طول السياق والأداء بشكل كبير مقارنة بنماذج RAG الأخرى.
الاسترجاع المعزز بالتوليد (RAG)
الاسترجاع المعزز بالتوليد (RAG)
يتكون المستوى الأول من بناء الوكيل من نهج التوليد المعزز بالاسترجاع (RAG). هذا نهج بسيط تم رؤيته مرارًا وتكرارًا من قبل. إنه يعالج طول سياق مليون ويستخدم خوارزمية RAG.
تتضمن العملية ما يلي:
- تقسيم السياق: يتم تقسيم السياق إلى قطع أقصر، بحيث لا يتجاوز كل قطع 512 رمز.
- الاحتفاظ بالقطع ذات الصلة: يتم الاحتفاظ فقط بأكثر القطع صلة ضمن السياق 8K.
- فصل تحويل التعليمات: يتم استخدام تعليمات معلومات منفصلة للتمييز بين أجزاء التعليمات وغير التعليمات من استفسارات المستخدمين. على سبيل المثال، تحويل الاستفسار "يجب أن ترد بـ 2,000 كلمة وأن تكون مفصلة قدر الإمكان. سؤالي هو متى تم اختراع الدراجات؟" إلى هيكل المطالبة.
- استخراج الكلمات الرئيسية: يمكن للنموذج استنتاج الكلمات الرئيسية متعددة اللغات من الجزء المعلوماتي من الاستفسار.
- استرجاع القطع ذات الصلة: يتم استخدام خوارزمية BM25، وهي طريقة استرجاع تقليدية تستند إلى الكلمات الرئيسية، لتحديد أكثر القطع صلة.
إن هذا النهج RAG سريع، ولكن قد يفوت القطع ذات الصلة إذا لم تتطابق مع كلمة رئيسية في الاستفسار.
القراءة قطعة بقطعة
القراءة قطعة بقطعة
المستوى الثاني من بناء الوكيل هو نهج "القراءة قطعة بقطعة". وجد الباحثون أن نهج RAG (التوليد المعزز بالاسترجاع) الأولي كان سريعًا إلى حد ما، ولكنه قد يفوت القطع ذات الصلة إذا لم تتطابق مع كلمة رئيسية في الاستفسار. لمعالجة هذا، قدموا استراتيجية أكثر قوة بروتية مع ثلاث خطوات:
- تقييم الصلة: نموذج يفحص كل قطعة 512 رمز لمدى صلتها بالاستفسار.
- استرجاع القطع: يتم استخدام الجمل ذات الصلة من الاستفسار لاسترجاع أكثر القطع صلة ضمن حد السياق 8K، باستخدام خوارزمية BM25.
- توليد الإجابة: يتم توليد الإجابة النهائية بناءً على السياق المسترجع، مشابهًا لطريقة RAG.
يعد هذا نهج القراءة قطعة بقطعة أكثر شمولاً في ضمان عدم فوات المعلومات ذات الصلة، حتى إذا لم تتطابق مع الكلمات الرئيسية الدقيقة في الاستفسار. من خلال فحص كل قطعة على حدة ثم استرجا
التعليمات
التعليمات