שחרר את כוחו של LLaMA 3.1: סוכן מקומי למידה עצמית לחלוקת ידע

גלה כיצד הדגם החזק של LLaMA 3.1 משחרר אפשרויות חדשות עבור סוכנים מקומיים המסוגלים ללמוד בעצמם, מאפשר הפצת ידע ופיתוח של סוכנים אוטונומיים. חקור את היכולות המרשימות שלו בקריאת כלים, דיאלוגים רב-תוריים, ומקרי שימוש אגנטיים בעולם האמיתי.

14 בפברואר 2025

party-gif

שחרר את כוחו של הבינה המלאכותית כדי להעצים את פריון העבודה שלך. גלה כיצד חברות מובילות מנצלות מודלי שפה חדשניים כמו Llama 3.1 כדי לבנות סוכנים חכמים שיכולים לבצע משימות באופן אוטומטי, להפיץ ידע ולשפר את השיתוף פעולה. פוסט הבלוג הזה מספק מדריך מעשי ליצירת סוכן Llama 3.1 המלמד את עצמו, ומעצים אותך לייעל תהליכים ולפתוח רמות חדשות של יעילות.

לאמה 3.1: החדשות הגדולות ביותר בשבוע שעבר

מטא הורגת את זה עם המשחק הקוד הפתוח שלהם, ונראה שהם כבר עובדים על Llama 4, שעשוי להיות מושלך עד סוף השנה. עם זאת, Llama 3.1 הפגין ביצועים מבטיחים מאוד על פני מגוון יכולות שונות, כמו קידוד מסכה, מעקב אחר הוראות וכו'.

חלק אחד שמצאתי שאנשים לא מדברים הרבה עליו, אבל אני מאוד מתרגש לגביו, הוא שמטא נראה שמתחילה להשקיע באמת בשימושים הקשורים לסוכן. הם מזכירים שהם מכוונים לא רק לpozitioningLlama כמודל, אלא כמערכת לספק כלים שמאפשרים למפתחים לבנות את הסוכנים המותאמים אישית שלהם, וכן סוגים חדשים של התנהגות סוכנית.

יש להם דוח ציבורי בשם "מערכת סוכנית Llama" שבו הם מציגים רכיבים שלמים של ערימת Llama. זה כולל דברים כמו Llama Guard, שהוא מודל ייעודי שהוכשר לפקח על תוכן, וכן Prompt Guard למניעת בריחות מהכלא וKoser למניעת קוד לא בטוח שמיוצר על ידי מודלי שפה גדולים.

אבל החלק המרגש ביותר עבורי הוא היכולת לקרוא כלים. קריאת כלים היא כנראה הסיבה העיקרית שהייתי צריך להשתמש ב-OpenAI, כי המודלים שלהם פשוט הרבה יותר טובים בשימושים הקשורים לקריאת כלים של סוכנים. אם אתה לא יודע מה זה קריאת כלים, זו מושג שהוצג על ידי OpenAI בסוף השנה שעברה. למעשה, זו סוג של מודל שמוכשר, נתון משימה של משתמש, לחזות איזו פונקציה צריך להיקרא, וכן את הקלט עבור אותה פונקציה, כך שנוכל לקחת את פלט ה-JSON כדי להריץ את הפונקציה בפועל ולשלוח מידע חזרה למודל השפה הגדול.

תוצאות ההערכה הראשוניות מראות שיכולת קריאת הכלים של Llama 3.1 נראית מבצעת מאוד בהשוואה למודלים אחרים כמו GPT-4 ו-Chinchilla 3.5. עם זאת, רוב ההערכות האלה הן מעין אפס-שוט של שימוש בכלים, שלא בהכרח מייצגות את ביצועי השימוש בכלים בפועל בעולם האמיתי, מכיוון שמקרי השימוש בסוכן בעולם האמיתי מורכבים הרבה יותר, כוללים שימוש בכלים במספר סיבובים, תכנון וכושר הסקה.

החדשות הטובות הן שב-Llama 3.1, נראה שהם הכשירו את המודל ספציפית עבור שיחות רב-סיבוביות האלה, כך שאם השאילתה דורשת קריאות כלים מרובות, המודל יכול לכתוב תכנית שלב אחר שלב, לקרוא את הכלים בסדר, ולבצע את ההסקה לאחר כל קריאת כלי.

באופן כללי, היכולת לקרוא כלים מ-Llama 3.1 היא צעד מרגש מאוד עבורנו כדי להיות להיות חלופה ל-OpenAI עבור מודל חזק עבור סוכנים.

ביצועים מבטיחים של לאמה 3.1 בפני מגוון יכולות

Llama 3.1 היא הגרסה העדכנית ביותר של המודל השפה הגדול הקוד הפתוח של מטא, והיא הפגינה ביצועים מרשימים על פני מגוון יכולות. כמה נקודות עיקריות כוללות:

  • קידוד מסכה: Llama 3.1 הפגין ביצועים חזקים במשימות מילוי מסכה, שבהן מבקשים מהמודל לחזות מילים או אסימונים חסרים בהקשר נתון.
  • מעקב אחר הוראות: המודל הוכיח שהוא מיומן בעקיבה אחר הוראות מורכבות ובביצוע משימות, מה שהופך אותו לכלי חשוב לבניית יישומים אינטראקטיביים.
  • התנהגות סוכנית: מטא השקיעה הרבה בפיתוח Llama כמערכת לבניית סוכנים מותאמים אישית ולאפשר סוגים חדשים של התנהגות סוכנית. זה כולל רכיבים כמו Llama Guard לפיקוח על תוכן ו-Prompt Guard למניעת פלטים לא בטוחים.
  • קריאת כלים: אחד ההיבטים המרגשים ביותר של Llama 3.1 הוא הביצועים החזקים שלה במשימות קריאת כלים. המודל יכול לחזות את הפונקציות המתאימות לקרוא ולספק את הקלטים הנחוצים, מה שמאפשר פיתוח של יישומי סוכן חזקים.

בעוד שתוצאות ההערכה הראשוניות ליכולת קריאת הכלים של Llama 3.1 מבטיחות, ביצועי העולם האמיתי בתרחישים מורכבים יותר, רב-סיבוביים, עדיין תחום שדורש חקירה נוספת. היכולת של המודל לשמור על הקשר, לתכנן ולהסיק דרך משימות רב-שלביות תהיה קריטית לבניית מערכות סוכן יעילות.

באופן כללי, Llama 3.1 מייצגת צעד משמעותי קדימה בפיתוח של מודלי שפה גדולים בקוד פתוח, וביכולותיה על פני מגוון משימות הופכות אותה לפלטפורמה מרגשת לבניית יישומי AI חדשניים.

מערכת הסוכנות של לאמה: מאפשרת למפתחים לבנות סוכנים מותאמים אישית

מטא משקיעה הרבה בשימושים הקשורים לסוכן של Llama, מpozitioningאותו לא רק כמודל שפה, אלא כמערכת לספק כלים שמאפשרים למפתחים לבנות את הסוכנים המותאמים אישית שלהם, וכן סוגים חדשים של התנהגות סוכנית.

מערכת הסוכנית של Llama כוללת מספר רכיבים עיקריים:

  1. Llama Guard: מודל ייעודי שהוכשר לפקח על תוכן ולמנוע בריחות מהכלא.
  2. Prompt Guard: כלי למניעת יצירת קוד לא בטוח על ידי מודלי Llama.
  3. קריאת כלים: יכולת חזקה המאפשרת למודלי Llama לחזות את הפונקציות הנדרשות להשלמת משימה, וכן את הקלטים עבור אותן פונקציות. זה מאפשר לסוכנים לפרק משימות מורכבות לשלבים קטנים יותר ולבצע אותם ביעילות.

המודל Llama 3.1 הפגין ביצועים מבטיחים בקריאת כלים, עולה על מודלים כמו GPT-4 ו-Closure 3.5 בשימוש בכלים ללא הדרכה. עם זאת, מקרי השימוש בסוכן בעולם האמיתי מורכבים יותר, ודורשים שיחות רב-סיבוביות, תכנון וכושר הסקה.

Llama 3.1 הוכשר במיוחד עבור שיחות רב-סיבוביות אלה, מאפשר למודל לכתוב תכניות שלב אחר שלב, לקרוא כלים בסדר, ולהסיק על בסיס תוצאות כל קריאת כלי. זהו התקדמות משמעותית לקראת בניית סוכנים חזקים ויכולים. צוות Llama גם סיפק דוגמאות לפרומפטים המדגימים את יכולת קריאת הכלים, שניתן להשתמש בהם כדי לכוונן ולבנות מודלים סוכניים ייעודיים. השקיפות והנגישות הזו מקלות על המפתחים לנצל את יכולות Llama בתוך יישומי סוכן משלהם.

באופן כללי, מערכת הסוכנית של Llama מייצגת צעד מרגש קדימה בהענקת אפשרות למפתחים לבנות סוכנים מותאמים אישית ולחקור אפיקים חדשים של התנהגות סוכנית, תוך ניצול היכולות החזקות של מודל השפה Llama.

קריאת כלים: המפתח לשימוש בסוכן של לאמה 3.1

המודל Llama 3.1 מפגין ביצועים מבטיחים על פני מגוון יכולות, כולל קידוד מסכה, מעקב אחר הוראות וקריאת כלים. יכולת קריאת הכלים היא מיוחדת במיוחד, שכן היא מאפשרת פיתוח של יישומי סוכן חזקים.

קריאת כלים היא מושג שהוצג על ידי OpenAI, שבו מודל מוכשר לחזות את הפונקציה שצריך לקרוא כדי להשלים משימה של משתמש, וכן את הקלט עבור אותה פונקציה. זה מאפשר למודל לייצר פלט JSON שניתן להריץ כדי לאחזר את המידע הנחוץ ולספק תגובה למשתמש.

יכולת קריאת הכלים של המודל Llama 3.1 נראית מבצעת טוב בהשוואה למודלים אחרים כמו GPT-4 ו-Closet 3.5. עם זאת, רוב ההערכות מתמקדות בשימוש בכלים ללא הדרכה, שלא בהכרח משקפות את ביצועי המודל במקרי השימוש בסוכן בעולם האמיתי.

מקרי השימוש בסוכן בעולם האמיתי לעתים קרובות כוללים שיחות רב-סיבוביות, שבהן משימת המשתמש לא ניתנת להשלמה על ידי קריאה של כלי יחיד. במקום זאת, המודל צריך לפרק את המשימה לשלבים קטנים יותר, לקרוא מספר כלים בסדר, ולהסיק על התוצאות כדי לספק תגובה מקיפה. נראה שהמודל Llama 3.1 מוכשר במיוחד עבור סוגי שיחות רב-סיבוביות אלה, מאפשר לו לכתוב תכניות שלב אחר שלב, לקרוא כלים בסדר ולבצע את ההסקה הנדרשת.

המודל Llama 3.1 גם מספק דוגמאות לפרומפטים המשמשים את יכולת קריאת הכלים שלו, שיכולות להיות שימושיות להבנת אופן פעולת המודל ולכוונון ספציפי למקרי שימוש סוכניים.

באופן כללי, יכולת קריאת הכלים של המודל Llama 3.1 היא צעד משמעותי קדימה בפיתוח של יישומי סוכן חזקים, מספקת חלופה להצעות של OpenAI ומאפשרת אפשרויות חדשות לאוטומציה והרחבה של משימות אנושיות.

בניית סוכן AI של לאמה 3.1: מדריך שלב-אחר-שלב

ראשית, אנו רוצים להוריד את מודל Llama 3

שאלות נפוצות