נצל את כוחו של גרף RAG: שחרר נתונים לא מובנים באמצעות חיפוש סמנטי, הטמעות ועוד
פתח את עוצמת Graph RAG לחיפוש סמנטי, استخراج מידע, וניתוח נתונים מתקדם. חקור את המסגרת הזו של יצירה מוגברת אחזור, המקור פתוח, המנצלת גרפי ידע כדי לשפר מודלי שפה גדולים. הגבר את הדיוק והרלוונטיות עבור שאילתות מורכבות.
20 בפברואר 2025

פתח את עוצמת החיפוש הסמנטי, הטמעות והחיפוש הווקטורי עם GraphRAG - מנוע RAG הקוד הפתוח הסופי מ-Microsoft AI. גלה כיצד פתרון חדשני זה יכול להפוך את יכולות ניתוח הנתונים והשאלות והתשובות שלך, מספק תובנות רלוונטיות ומהימנות יותר.
מהו RAG (Retrieval Augmented Generation)?
כיצד GraphRAG שונה מהמערכות RAG המסורתיות?
מתחילים עם GraphRAG
אינדקסינג והגדרת תצורה של GraphRAG
שיחה עם GraphRAG
מהו RAG (Retrieval Augmented Generation)?
מהו RAG (Retrieval Augmented Generation)?
RAG (Retrieval Augmented Generation) היא גישה המשמשת לשיפור של דגמי שפה גדולים קיימים על ידי שילוב של ידע חיצוני. הרעיון המרכזי מאחורי RAG הוא לשלב את הכוח של דגמי שפה גדולים עם היכולת לאחזר ולנצל מידע רלוונטי ממקורות חיצוניים, כמו בסיסי ידע או קורפוסים טקסטואליים.
היתרונות העיקריים של גישת RAG הם:
-
שיפור הרלוונטיות: על ידי אחזור והטמעה של מידע רלוונטי, RAG יכול לספק תגובות מדויקות ורלוונטיות יותר, בעיקר לשאלות הדורשות ידע ספציפי.
-
הפחתת הזיות: נמצא שRAG מפחית את הנטייה של דגמי שפה גדולים ליצור תוכן מזויף או עובדתית שגוי, מכיוון שהתגובות מעוגנות במידע שנאחזר.
-
גמישות: בנוסף לענייני שאלות ותשובות, RAG ניתן ליישום למגוון משימות עיבוד שפה טבעית כמו חילוץ מידע, המלצות, ניתוח רגשות וסיכום.
-
טיפול בנתונים פרטיים: RAG יכול לעבוד עם מערכות נתונים פרטיות או רגישות, מכיוון שהמידע מעובד ומאוחסן באופן מקומי, ללא הצורך לשתף את הנתונים עם שירותים חיצוניים.
כיצד GraphRAG שונה מהמערכות RAG המסורתיות?
כיצד GraphRAG שונה מהמערכות RAG המסורתיות?
GraphRAG מהווה התקדמות משמעותית מעבר למערכות RAG (Retrieval Augmented Generation) המסורתיות. להלן ההבדלים:
-
חילוץ גרף ידע: בשונה מאחזור טקסט פשוט, GraphRAG משלב חילוץ טקסט עם ניתוח רשת ופרומפטינג של דגם שפה כדי לבנות גרף ידע מקיף מהנתונים הנתונים. זה מאפשר הבנה עמוקה ומקיפה יותר של התוכן.
-
שיפור בדיוק ורלוונטיות: על ידי ניצול גרף הידע, GraphRAG יכול לספק תגובות מדויקות ורלוונטיות יותר, בעיקר עבור מערכות נתונים מורכבות או ייעודיות. הגישה המבוססת על גרף עוזרת לקשר בין חלקי מידע שונים ולסנתז תובנות שעולות על טכניקות RAG בסיסיות.
-
הבנה מקיפה של הנתונים: GraphRAG מאמץ גישה מקיפה יותר, משפרת את ההבנה והסיכום הכולל של אוספי נתונים גדולים. זה הופך אותו לבחירה עדיפה לניצול של דגמי שפה גדולים במשימות ניתוח נתונים מתקדמות ושאלות ותשובות.
-
הפחתת הזיות: נמצא שGraphRAG מפחית את הנטייה של דגמי שפה גדולים ליצור תוכן "מזויף" שאינו מעוגן במידע שסופק. הגישה המבוססת על גרף עוזרת למודל להיצמד יותר למידע המהימן בהקשר.
-
גמישות: בנוסף לשאלות ותשובות, GraphRAG ניתן ליישום למגוון משימות עיבוד שפה טבעית, כמו חילוץ מידע, המלצות, ניתוח רגשות וסיכום, כל זאת בסביבת אחסון פרטית ומקומית.
מתחילים עם GraphRAG
מתחילים עם GraphRAG
כדי להתחיל עם GraphRAG, עליך לבצע את השלבים הבאים:
-
התקנת דרישות מוקדמות:
- ודא שיש לך Python מותקן במערכת שלך.
- התקן את החבילות הנדרשות על ידי הרצת
pip install graphrag
בטרמינל או בשורת הפקודה.
-
שכפול המאגר:
- פתח את Visual Studio Code (או את הסביבה המועדפת עליך) וצור תיקייה חדשה עבור הפרויקט.
- בטרמינל, נווט אל תיקיית הפרויקט והרץ
git clone https://github.com/microsoft/graph-rag.git
כדי לשכפל את מאגר GraphRAG.
-
הגדרת הסביבה:
- בטרמינל, נווט אל תיקיית
graph-rag
. - ייצא את מפתח ה-API של OpenAI על ידי הרצת
export GRAPHRAG_API_KEY=your_api_key_here
.
- בטרמינל, נווט אל תיקיית
-
יצירת תיקיית קלט:
- בטרמינל, הרץ
mkdir input
כדי ליצור תיקייה לקלט עבור המסמכים שלך.
- בטרמינל, הרץ
-
אינדקס המסמכים:
- הנח את המסמכים שלך (למשל, קבצי טקסט, PDF) בתיקיית
input
. - בטרמינל, הרץ
python dm_rag_index.py
כדי לאינדקס את המסמכים.
- הנח את המסמכים שלך (למשל, קבצי טקסט, PDF) בתיקיית
-
שוחח עם המסמכים:
- בטרמינל, הרץ
python dm_graph_rag.py --query "your_query_here" --root_dir . --method global
. - החלף
"your_query_here"
בשאלה או בבקשה שברצונך לשאול על המסמכים.
- בטרמינל, הרץ
GraphRAG יעשה שימוש בגרף הידע שיצר במהלך תהליך האינדקס כדי לספק תגובות רלוונטיות ומקיפות לשאלות שלך, עולה על טכניקות RAG מסורתיות.
אינדקסינג והגדרת תצורה של GraphRAG
אינדקסינג והגדרת תצורה של GraphRAG
כדי להתחיל עם GraphRAG, עליך לבצע את השלבים הבאים:
-
התקנת דרישות מוקדמות:
- ודא שיש לך Python מותקן במערכת שלך.
- התקן את Pip על ידי הרצת הפקודה המסופקת בשורת הפקודה שלך.
-
שכפול המאגר:
- פתח את Visual Studio Code וצור חלון חדש.
- פתח את הטרמינל על ידי לחיצה על לחצן הפאנל ההפעלה.
- בטרמינל, נווט אל הסביבה של Bash והרץ את הפקודה
pip install graphrag
כדי להתקין את החבילות הנדרשות.
-
הגדרת הסביבה:
- בטרמינל, הקלד
cd graphrag
כדי לנווט אל המאגר שנשכפל. - ייצא את מפתח ה-API של OpenAI על ידי הרצת הפקודה
export GRAPHRAG_API_KEY=your_api_key_here
.
- בטרמינל, הקלד
-
יצירת תיקיית קלט:
- בטרמינל, הרץ את הפקודה
mkdir input
כדי ליצור תיקייה לקלט שבה תניח את הקבצים או המסמכים שלך. - פתח את התיקייה ב-VS Code על ידי לחיצה על "File" > "Open Folder" ובחירה במאגר שנשכפל.
- בטרמינל, הרץ את הפקודה
-
אינדקס המסמך:
- הנח את המסמך שלך (למשל, דוח פיננסי) בתיקיית הקלט.
- בטרמינל, הרץ את הפקודה
python dm_rrag index
כדי לאינדקס את המסמך הנוכחי. - זה יצור דוח קהילה על המסמך המאוינדקס, שאותו תוכל להשתמש כעת לשיחה.
-
תצורת הסביבה:
- בקובץ
env
, תוכל להגדיר את מפתח ה-API, סוג המודל וההגדרות האחרות. - תוכל לציין את השימוש במודל LLAMA או בממשק של OpenAI.
- שמור את השינויים בקובץ
env
.
- בקובץ
-
הרץ את הקוד:
- בטרמינל, הרץ את הפקודה
python dm_rrag query --root_folder . --method global --query "your_query_here"
כדי להתחיל לשוחח עם המסמך המאוינדקס.
- בטרמינל, הרץ את הפקודה
שיחה עם GraphRAG
שיחה עם GraphRAG
כדי לשוחח עם GraphRAG, עליך לבצע את השלבים הבאים:
-
לאחר אינדקס המסמך באמצעות הפקודה
python dm_rrag index
, תוכל להתחיל את השיחה על ידי הרצת הפקודהpython dm_rrag query --root_folder . --method global "your query here"
. -
החלף
"your query here"
בשאלה או בבקשה שברצונך לשאול את GraphRAG על המסמך המאוינדקס. -
GraphRAG ישתמש בגרף הידע שיצר במהלך תהליך האינדקס כדי לספק תגובה רלוונטית ומידעית, תוך ניצול הכוח של דגמי שפה גדולים והמידע המובנה בגרף הידע.
-
תוכל להמשיך לשוחח עם GraphRAG על ידי הרצת אותה פקודה עם שאלות שונות. המערכת תשתמש בגרף הידע הקיים כדי לספק תגובות המותאמות לשאלות שלך.
-
אם ברצונך להחליף למודל שפה שונה, תוכל להגדיר את המודל בקובץ
.env
על ידי ציוןLLM_TYPE
ומתן את נקודת הקצה המתאימה או נתיב המודל המקומי. -
הגישה המקיפה של GraphRAG לייצור מבוסס אחזור מאפשרת לו לעלות על טכניקות RAG בסיסיות מסורתיות, בעיקר עבור מערכות נתונים מורכבות או פרטיות, על ידי חיבור של חלקי מידע שונים וספק תובנות מסונתזות.
שאלות נפוצות
שאלות נפוצות