לְפַתֵחַ אֶת כֹּחַ הַדְּגָמִים הַלְּשׁוֹנִיִּים הַגְּדוֹלִים: שִׁלְטוֹן בְּהוֹצָאַת טֶקְסְט PDF וּבְנִיתּוּחַ

לנצל את כוחם של דגמי שפה גדולים כדי לפתוח אפשרויות חדשות בהפקת טקסט מ-PDF וניתוחו. גלה טכניקות מעשיות לאחזור מידע יעיל, הטמעת מסמכים ועוד. שפר את מיומנויותיך, חדש ותתחבר לקהילה של מקצוענים בעלי אותן השקפות.

14 בפברואר 2025

party-gif

פתח את עוצמת הדגמים השפתיים הגדולים כדי להפוך את מסמכי הטקסט שלך עם קורס RAG Beyond Basics. מיועד למייסדי SaaS, מפתחים, מנהלים ותחביבנים, קורס זה יצייד אותך בטכניקות מעשיות כדי לנתח ולהתקשר ביעילות עם קבצי PDF ומסמכי טקסט אחרים. קבל ניסיון מעשי בבניית חבילת Python עמידה שאתה יכול ליישם מיד בפרויקטים שלך.

מה הקורס הזה עוסק בו?

הקורס הזה נועד ללמד אותך כיצד להתמודד באופן יעיל עם מסמכים מבוססי-טקסט באמצעות כוחם של מודלי שפה גדולים (LLMs). הדגש יהיה על עבודה עם מסמכי PDF, מכיוון שזהו הפורמט הנפוץ ביותר בסביבת העסקים. עם זאת, הטכניקות שתלמד ניתן ליישם על כל סוג של מסמך מבוסס-טקסט.

הקורס יתחיל בבניית תשתית אחזור בסיסית וחקירת רכיביה השונים. מכאן, נצלול לתוך טכניקות מתקדמות יותר, כגון דירוג מחדש, הרחבת שאילתה, אחזור מרובה-שאילתה וייצוג מסמך היפותטי. נכסה גם כיצד לשלב חיפוש סמנטי עם חיפוש מבוסס-מילות-מפתח, ונחקור את השימוש במאחזר המסמכים הפירמידלי להרחבת ההקשר שנאחזר על ידי מודל הייצוג.

למי הקורס הזה מיועד?

הקהל היעד לקורס זה הם מייסדי SaaS, מפתחים, מנהלים ומשתמשים חובבים. כדי להפיק את המרב מהקורס, תזדקק לרקע בפייתון. הקורס יעזור לך להפוך את הרעיונות הבריליאנטיים שלך למעגלים עובדים ולנתח אלפי מסמכים בדקות, ולא בימים.

מה נכסה בקורס הזה?

במהלך הקורס, נכסה מגוון רחב של נושאים הקשורים לאינטראקציה עם מסמכים מבוססי-טקסט באמצעות כוחם של מודלי שפה גדולים (LLMs). הדגש יהיה על עבודה עם מסמכי PDF, מכיוון שזהו הפורמט הנפוץ ביותר בסביבת העסקים.

נתחיל בבניית תשתית אחזור בסיסית וחקירת רכיביה השונים, תוך יישומם בקוד. מכאן, נצלול לתוך טכניקות מתקדמות יותר לשיפור ביצועי תשתית האחזור, כגון דירוג מחדש, הרחבת שאילתה ואחזור מרובה-שאילתה.

בנוסף, נחקור טכניקות ליצירת מסמכים היפותטיים על בסיס הבעיה שאתה עובד עליה, המכונה "ייצוג מסמך היפותטי". נבחן גם דרכים לשלב מספר אחזורים כדי לשפר את ביצועי תשתית האחזור, תוך שילוב טכניקות חיפוש סמנטי עם חיפוש מבוסס-מילות-מפתח.

בנוסף, נכסה את מאחזר המסמכים הפירמידלי, טכניקה המסייעת להרחיב את ההקשר שנאחזר על ידי מודל הייצוג.

לאורך הקורס, הדגש לא יהיה רק על הבנת הטכניקות השונות, אלא גם על מתי ומדוע להשתמש בהן. נספק דוגמאות קוד מעשיות כדי להדגים כיצד ליישם טכניקות אלה בתרחישים שונים.

מדוע כדאי לך להצטרף לקורס הזה?

קורס זה נועד לספק לך מיומנויות ידע מעשיים לניצול כוחם של מודלי שפה גדולים (LLMs) באינטראקציה עם מסמכים מבוססי-טקסט, בעיקר PDF. כמשתתף, תלמד כיצד לבנות תשתיות אחזור חסונות, ליישם טכניקות מתקדמות כמו דירוג מחדש, הרחבת שאילתה ואחזור מרובה-שאילתה, ולחקור שיטות ליצירת מסמכים היפותטיים על בסיס הצרכים הספציפיים שלך.

המרצה, בעל תואר דוקטור ומעל 7 שנות ניסיון בתעשייה בהובלת צוותי למידת מכונה ובינה מלאכותית, בעל רקע טכני חזק ותשוקה לפרויקטים קוד פתוח. הם בנו מערכות המניעות עשרות אלפי התקנים לצרכנים וייצרו אחד מפרויקטי RAG הפתוחים הפופולריים ביותר, Local GPT, שיש לו למעלה מ-19,000 כוכבים ב-GitHub.

בהצטרפותך לקורס זה, תזכה להעצים את מיומנויותיך, לחדש בתחומך ולהתחבר לקהילה של מקצוענים בעלי אינטרסים דומים. הקורס יספק לך חבילת פייתון עובדת שתוכל להשתמש בה בפרויקטים שלך, ותקבל גישה לערוץ ייעודי בשרת הדיסקורד של Prompt Engineering, שם תוכל לשוחח ישירות עם המרצה ועם עמיתים אחרים על הנושאים הנדונים בקורס ומעבר להם.

אילו מודלים נשתמש בקורס הזה?

הקורס יתמקד בעיקר בשימוש במודלי שפה גדולים (LLMs) ומודלי ייצוג מאת OpenAI. הסיבה לכך היא שהאפי של OpenAI מספק דרך פשוטה וישירה לבניית פרוטוטיפים במהירות. עם זאת, בחלק המאוחר יותר של הקורס, נחקור גם כיצד להשתמש במודלי LLM ומודלי ייצוג מקומיים כדי להפעיל את כל התשתית באופן מקומי, מבלי להסתמך על כל API חיצוני. זה יעניק לך את הגמישות להשתמש במודלים של בחירתך ולהפעיל את המערכת לחלוטין ללא תלות באינטרנט.

המודלים הספציפיים שנשתמש בהם כוללים:

  • GPT-3 של OpenAI ומודלי LLM אחרים לביצוע מגוון משימות של הבנת טקסט וייצור טקסט
  • מודלי ייצוג של OpenAI לייצור ייצוגים סמנטיים של טקסט
  • מודלי LLM ומודלי ייצוג מקומיים, כמו אלה של Hugging Face, לאפשר הפעלה מקומית מלאה

בסיום הקורס, תהיה לך הבנה יסודית של כיצד לנצל מודלים אלה לבניית יישומי עיבוד מסמכים מבוססי-טקסט עוצמתיים, ותקבל חבילת פייתון עובדת שתוכל להשתמש בה בפרויקטים שלך.

מסקנה

קורס זה בנושא "מעבר לבסיסי" נועד לצייד אותך בידע ובמיומנויות כדי להתמודד באופן יעיל עם מסמכים מבוססי-טקסט באמצעות כוחם של מודלי שפה גדולים (LLMs). בין אם אתה מייסד SaaS, מפתח, מנהל או חובב, הקורס הזה יספק לך טכניקות מעשיות להפוך את הרעיונות שלך למעגלים עובדים ולנתח כמויות עצומות של מסמכים בשבריר מהזמן.

לאורך הקורס, נכסה מגוון רחב של נושאים, כולל בניית תשתית אחזור בסיסית, טכניקות מתקדמות כמו דירוג מחדש, הרחבת שאילתה ואחזור מרובה-שאילתה. נחקור גם ייצוג מסמכים והשילוב של חיפוש סמנטי עם שיטות חיפוש מבוססות-מילות-מפתח מסורתיות. בנוסף, נעמיק בשימוש במאחזר המסמכים הפירמידלי להרחבת ההקשר שנאחזר על ידי מודל הייצוג.

המיקוד של קורס זה אינו רק על הבנת הטכניקות האלה, אלא גם על מתי ומדוע להשתמש בהן. תקבל דוגמאות קוד מעשיות שיעזרו לך ליישם אסטרטגיות אלה בפרויקטים שלך. בנוסף, תקבל חבילת פייתון עובדת שתוכל להשתמש בה בפעילויות העתידיות שלך.

הקורס יכסה בתחילה את הנושאים הליבה האלה, אך מכיוון שתחום האחזור והייצור (RAG) מתפתח בקצב מהיר, הקורס יעודכן עם הרצאות ותוכן חדשים כדי להבטיח שתישאר בחזית ההתפתחויות האחרונות.

המרצה, בעל תואר דוקטור ומעל שבע שנות ניסיון בתעשייה בהובלת צוותי למידת מכונה וביינה מלאכותית, מתלהב מפרויקטי קוד פתוח והקים את אחד הפרויקטים הפתוחים הפופולריים ביותר של RAG, Local GPT, עם למעלה מ-19,000 כוכבים ב-GitHub. תזכה להתקשר ישירות עם המרצה ועם עמיתים אחרים דרך ערוץ ייעודי בשרת הדיסקורד של Prompt Engineering, מה שיאפשר לך להעצים את מיומנויותיך, לחדש בתחומך ולהתחבר לקהילה של מקצוענים בעלי אינטרסים דומים.

הצטרף אלינו למסע המרתק הזה לשלוט באמנות האינטראקציה עם מסמכים מבוססי-טקסט באמצעות כוחם של LLMs ולשחרר אפשרויות חדשות בתחומך.

שאלות נפוצות