استغل قوة الرسم البياني RAG: افتح البيانات غير المهيكلة باستخدام البحث الدلالي والتضمينات وأكثر من ذلك
افتح قوة Graph RAG للبحث الدلالي، واستخراج المعلومات، والتحليل المتقدم للبيانات. استكشف هذا الإطار المفتوح المصدر للتوليد المعزز بالاسترجاع الذي يستفيد من الرسوم البيانية المعرفية لتعزيز نماذج اللغة الكبيرة. زيادة الدقة والصلة للاستعلامات المعقدة.
٢٤ فبراير ٢٠٢٥

افتح قوة البحث الدلالي والتضمينات والبحث المتجهي مع GraphRAG - محرك RAG المفتوح المصدر النهائي من Microsoft AI. اكتشف كيف يمكن لهذا الحل المبتكر أن يحول قدرات تحليل البيانات والإجابة على الأسئلة لديك، مما يوفر معلومات أكثر صلة وموثوقية.
ما هو RAG (Retrieval Augmented Generation)؟
كيف يختلف GraphRAG عن أنظمة RAG التقليدية؟
البدء باستخدام GraphRAG
فهرسة وتكوين GraphRAG
الدردشة مع GraphRAG
ما هو RAG (Retrieval Augmented Generation)؟
ما هو RAG (Retrieval Augmented Generation)؟
RAG (Retrieval Augmented Generation) هو نهج يستخدم لتعزيز نماذج اللغة الكبيرة القائمة من خلال دمج المعرفة الخارجية. الفكرة الرئيسية وراء RAG هي الجمع بين قوة نماذج اللغة الكبيرة مع القدرة على استرداد والاستفادة من المعلومات ذات الصلة من مصادر خارجية، مثل قواعد المعرفة أو مجموعات النصوص.
الفوائد الرئيسية لنهج RAG هي:
-
تحسين الصلة: من خلال استرداد ودمج المعلومات ذات الصلة، يمكن لRAG توفير استجابات أكثر دقة وصلة، خاصة للأسئلة التي تتطلب معرفة محددة.
-
تقليل الهلوسة: تم إثبات أن RAG يقلل من ميل نماذج اللغة الكبيرة إلى إنشاء محتوى مهلوس أو غير صحيح من الناحية الواقعية، حيث تكون الاستجابات مرتبطة بالمعلومات المسترجعة.
-
التنوع: بالإضافة إلى الإجابة على الأسئلة، يمكن تطبيق RAG على مهام معالجة اللغة الطبيعية المختلفة مثل استخراج المعلومات والتوصية وتحليل المشاعر والتلخيص.
-
معالجة البيانات الخاصة: يمكن لRAG العمل مع مجموعات بيانات خاصة أو حساسة، حيث يتم معالجة والاحتفاظ بالمعلومات محليًا، دون الحاجة إلى مشاركة البيانات مع خدمات خارجية.
كيف يختلف GraphRAG عن أنظمة RAG التقليدية؟
كيف يختلف GraphRAG عن أنظمة RAG التقليدية؟
GraphRAG هو تقدم كبير على أنظمة RAG (Retrieval Augmented Generation) التقليدية. فيما يلي كيف يختلف عنها:
-
استخراج المعرفة الرسومية: على عكس الاسترداد النصي البسيط، يقوم GraphRAG بدمج استخراج النص مع تحليل الشبكة وتحفيز نموذج اللغة لبناء رسم بياني للمعرفة شامل من البيانات الأصلية. هذا يسمح بفهم أعمق وأكثر شمولاً للمحتوى.
-
تحسين الدقة والصلة: من خلال الاستفادة من الرسم البياني للمعرفة، يمكن لGraphRAG توفير استجابات أكثر دقة وصلة، خاصة للبيانات المعقدة أو المتخصصة. يساعد النهج القائم على الرسم البياني في ربط أجزاء المعلومات المتفرقة وتركيب الرؤى التي تتفوق على تقنيات RAG الأساسية.
-
فهم البيانات الشامل: يتبع GraphRAG نهجًا أكثر شمولاً، مما يعزز الفهم الشامل والتلخيص لمجموعات البيانات الكبيرة. هذا يجعله خيارًا أفضل لتسخير نماذج اللغة الكبيرة في تحليل البيانات المتقدم ومهام الإجابة على الأسئلة.
-
تقليل الهلوسة: تم إثبات أن GraphRAG يقلل من ميل نماذج اللغة الكبيرة إلى إنشاء محتوى "مهلوس" غير مرتبط بالمعلومات المقدمة. يساعد النهج القائم على الرسم البياني النموذج على الالتزام بشكل أوثق بالمعلومات الموثوقة في السياق.
-
التنوع: بالإضافة إلى الإجابة على الأسئلة، يمكن تطبيق GraphRAG على مجموعة متنوعة من مهام معالجة اللغة الطبيعية، مثل استخراج المعلومات والتوصيات وتحليل المشاعر والتلخيص، كل ذلك في بيئة تخزين محلية وخاصة.
بشكل عام، يمثل GraphRAG تقدمًا كبيرًا في مجال التوليد المعزز بالاسترداد، مما يوفر دقة وصلة وفهمًا شاملاً للبيانات أفضل، مما يجعله إطارًا قويًا لتسخير نماذج اللغة الكبيرة في التطبيقات المتقدمة.
البدء باستخدام GraphRAG
البدء باستخدام GraphRAG
للبدء باستخدام GraphRAG، اتبع هذه الخطوات:
-
تثبيت المتطلبات الأساسية:
- تأكد من وجود Python مثبت على نظامك.
- قم بتثبيت الحزم المطلوبة من خلال تشغيل
pip install graphrag
في طرفيتك أو موجه الأوامر.
-
استنساخ المستودع:
- افتح Visual Studio Code (أو البيئة المفضلة لديك) وأنشئ مجلدًا جديدًا للمشروع.
- في الطرفية، انتقل إلى مجلد المشروع وقم بتشغيل
git clone https://github.com/microsoft/graph-rag.git
لاستنساخ مستودع GraphRAG.
-
إعداد البيئة:
- في الطرفية، انتقل إلى دليل
graph-rag
. - قم بتصدير مفتاح API الخاص بك لـ OpenAI من خلال تشغيل
export GRAPHRAG_API_KEY=your_api_key_here
.
- في الطرفية، انتقل إلى دليل
-
إنشاء مجلد الإدخال:
- في الطرفية، قم بتشغيل
mkdir input
لإنشاء مجلد الإدخال لمستنداتك.
- في الطرفية، قم بتشغيل
-
فهرسة المستندات:
- ضع مستنداتك (على سبيل المثال، ملفات نصية، PDF) في مجلد
input
. - في الطرفية، قم بتشغيل
python dm_rag_index.py
لفهرسة المستندات.
- ضع مستنداتك (على سبيل المثال، ملفات نصية، PDF) في مجلد
-
الدردشة مع المستندات:
- في الطرفية، قم بتشغيل
python dm_graph_rag.py --query "your_query_here" --root_dir . --method global
. - استبدل
"your_query_here"
بالسؤال أو الاستفسار الذي تريد طرحه حول المستندات.
- في الطرفية، قم بتشغيل
سيستخدم GraphRAG الآن الرسم البياني للمعرفة الذي أنشأه خلال عملية الفهرسة لتوفير استجابات ذات صلة وشاملة لاستفساراتك، متفوقًا على تقنيات التوليد المعزز بالاسترداد التقليدية.
فهرسة وتكوين GraphRAG
فهرسة وتكوين GraphRAG
للبدء باستخدام GraphRAG، ستحتاج إلى اتباع هذه الخطوات:
-
تثبيت المتطلبات الأساسية:
- تأكد من وجود Python مثبت على نظامك.
- قم بتثبيت Pip من خلال تشغيل الأمر المقدم في موجه الأوامر الخاص بك.
-
استنساخ المستودع:
- افتح Visual Studio Code وأنشئ نافذة جديدة.
- افتح الطرفية من خلال النقر على زر تبديل اللوحة.
- في الطرفية، انتقل إلى بيئة Bash وقم بتشغيل الأمر
pip install graphrag
لتثبيت الحزم الضرورية.
-
إعداد البيئة:
- في الطرفية، اكتب
cd graphrag
للانتقال إلى المستودع المنسوخ. - قم بتصدير مفتاح API الخاص بك لـ OpenAI من خلال تشغيل الأمر
export GRAPHRAG_API_KEY=your_api_key_here
.
- في الطرفية، اكتب
-
إنشاء مجلد الإدخال:
- في الطرفية، قم بتشغيل الأمر
mkdir input
لإنشاء مجلد الإدخال حيث ستضع ملفاتك أو مستنداتك. - افتح المجلد في VS Code من خلال النقر على "File" > "Open Folder" وتحديد المستودع المنسوخ.
- في الطرفية، قم بتشغيل الأمر
-
فهرسة المستند:
- ضع مستندك (على سبيل المثال، تقرير مالي) في مجلد الإدخال.
- في الطرفية، قم بتشغيل الأمر
python dm_rrag index
لفهرسة المستند الحالي. - سيؤدي هذا إلى إنشاء تقرير مجتمعي حول المستند المفهرس، والذي يمكنك الآن استخدامه للدردشة.
-
تكوين البيئة:
- في ملف
env
، يمكنك تكوين مفتاح API والنوع النموذجي والإعدادات الأخرى. - يمكنك تحديد استخدام نموذج LLAMA أو واجهة OpenAI.
- قم بحفظ التغييرات في ملف
env
.
- في ملف
-
تشغيل الكود:
- في الطرفية، قم بتشغيل الأمر
python dm_rrag query --root_folder . --method global --query "your_query_here"
لبدء الدردشة مع المستند المفهرس.
- في الطرفية، قم بتشغيل الأمر
من خلال اتباع هذه الخطوات، يمكنك إعداد GraphRAG وفهرسة مستنداتك والبدء في استخدام قدرات التوليد المعزز بالاسترداد لتعزيز مهام معالجة اللغة الطبيعية الخاصة بك.
الدردشة مع GraphRAG
الدردشة مع GraphRAG
للدردشة مع GraphRAG، اتبع هذه الخطوات:
-
بعد فهرسة المستند باستخدام الأمر
python dm_rrag index
، يمكنك بدء الدردشة من خلال تشغيل الأمرpython dm_rrag query --root_folder . --method global "your query here"
. -
استبدل
"your query here"
بالسؤال أو الطلب الذي تريد طرحه على GraphRAG حول المستند المفهرس. -
سيستخدم GraphRAG الآن الرسم البياني للمعرفة الذي أنشأه خلال عملية الفهرسة لتوفير استجابة ذات صلة ومفيدة، مستفيدًا من قوة نماذج اللغة الكبيرة والمعلومات المنظمة في الرسم البياني للمعرفة.
-
يمكنك متابعة الدردشة مع GraphRAG من خلال تشغيل نفس الأمر مع استفسارات مختلفة. سيستخدم النظام الرسم البياني للمعرفة الحالي لتوفير استجابات مصممة لأسئلتك.
-
إذا كنت ترغب في التبديل إلى نموذج لغة مختلف، يمكنك تكوين النموذج في ملف
.env
من خلال تحديدLLM_TYPE
وتوفير نقطة نهاية API المناسبة أو مسار النموذج المحلي. -
يسمح النهج الشامل لGraphRAG للتوليد المعزز بالاسترداد بتفوقه على تقنيات RAG الأساسية التقليدية، خاصة للبيانات المعقدة أو الخاصة، من خلال ربط أجزاء المعلومات المتفرقة وتوفير رؤى مركبة.
التعليمات
التعليمات