Sfrutta il potere di Graph RAG: sblocca i dati non strutturati con la ricerca semantica, gli embedding e molto altro

Sblocca il potere di Graph RAG per la ricerca semantica, l'estrazione di informazioni e l'analisi avanzata dei dati. Esplora questo framework di generazione potenziata dal recupero open-source che sfrutta i grafi della conoscenza per migliorare i modelli di linguaggio su larga scala. Migliora accuratezza e rilevanza per query complesse.

14 febbraio 2025

Sblocca il potere della ricerca semantica, degli embedding e della ricerca vettoriale con GraphRAG - il motore RAG open-source definitivo di Microsoft AI. Scopri come questa soluzione innovativa può trasformare le tue capacità di analisi dei dati e di risposta alle domande, offrendo informazioni più pertinenti e affidabili.

Cos'è RAG (Retrieval Augmented Generation)?
In che modo GraphRAG è diverso dai sistemi RAG tradizionali?
Iniziare con GraphRAG
Indicizzazione e configurazione di GraphRAG
Chattare con GraphRAG

Cos'è RAG (Retrieval Augmented Generation)?

RAG (Retrieval Augmented Generation) è un approccio utilizzato per migliorare i grandi modelli linguistici esistenti incorporando conoscenze esterne. L'idea chiave dietro RAG è di combinare la potenza dei grandi modelli linguistici con la capacità di recuperare e sfruttare informazioni rilevanti da fonti esterne, come basi di conoscenza o corpora di testi.

I principali vantaggi dell'approccio RAG sono:

Maggiore rilevanza: Recuperando e incorporando informazioni rilevanti, RAG può fornire risposte più accurate e pertinenti, soprattutto per domande che richiedono conoscenze specifiche.
Riduzione delle allucinazioni: È stato dimostrato che RAG riduce la tendenza dei grandi modelli linguistici a generare contenuti allucinati o inesatti dal punto di vista fattuale, poiché le risposte sono ancorate alle informazioni recuperate.
Versatilità: Oltre alla risposta alle domande, RAG può essere applicato a vari compiti di NLP come l'estrazione di informazioni, la raccomandazione, l'analisi del sentiment e il riassunto.
Gestione di dati privati: RAG può funzionare con set di dati privati o sensibili, poiché le informazioni vengono elaborate e memorizzate localmente, senza la necessità di condividere i dati con servizi esterni.

In che modo GraphRAG è diverso dai sistemi RAG tradizionali?

GraphRAG rappresenta un notevole progresso rispetto ai sistemi RAG (Retrieval Augmented Generation) tradizionali. Ecco come si differenzia:

Estrazione del grafo della conoscenza: A differenza del semplice recupero basato su testo, GraphRAG combina l'estrazione di testo, l'analisi di rete e il prompting del modello linguistico per costruire un grafo della conoscenza completo dai dati di input. Ciò consente una comprensione più profonda e olistica del contenuto.
Maggiore accuratezza e rilevanza: Sfruttando il grafo della conoscenza, GraphRAG può fornire risposte più accurate e pertinenti, soprattutto per set di dati complessi o specializzati. L'approccio basato sul grafo aiuta a connettere parti di informazioni disparate e a sintetizzare intuizioni che superano le tecniche RAG di base.
Comprensione olistica dei dati: GraphRAG segue un approccio più completo, migliorando la comprensione e il riassunto complessivi di grandi raccolte di dati. Ciò lo rende una scelta superiore per sfruttare i grandi modelli linguistici in compiti avanzati di analisi dei dati e risposta alle domande.
Riduzione delle allucinazioni: È stato dimostrato che GraphRAG riduce le tendenze dei grandi modelli linguistici a generare contenuti "allucinati" che non sono ancorati alle informazioni fornite. L'approccio basato sul grafo aiuta il modello a aderire più strettamente alle informazioni affidabili nel contesto.
Versatilità: Oltre alla risposta alle domande, GraphRAG può essere applicato a una varietà di compiti di elaborazione del linguaggio naturale, come l'estrazione di informazioni, le raccomandazioni, l'analisi del sentiment e il riassunto, tutto in un ambiente di archiviazione privato e locale.

Iniziare con GraphRAG

Per iniziare con GraphRAG, segui questi passaggi:

Installa i prerequisiti:
- Assicurati di avere Python installato sul tuo sistema.
- Installa i pacchetti richiesti eseguendo pip install graphrag nel tuo terminale o prompt dei comandi.
Clona il repository:
- Apri Visual Studio Code (o il tuo IDE preferito) e crea una nuova cartella per il progetto.
- Nel terminale, naviga nella cartella del progetto ed esegui git clone https://github.com/microsoft/graph-rag.git per clonare il repository GraphRAG.
Imposta l'ambiente:
- Nel terminale, naviga nella directory graph-rag.
- Esporta la tua chiave API di OpenAI eseguendo export GRAPHRAG_API_KEY=your_api_key_here.
Crea una cartella di input:
- Nel terminale, esegui mkdir input per creare una cartella di input per i tuoi documenti.
Indicizza i documenti:
- Posiziona i tuoi documenti (ad esempio, file di testo, PDF) nella cartella input.
- Nel terminale, esegui python dm_rag_index.py per indicizzare i documenti.
Chatta con i documenti:
- Nel terminale, esegui python dm_graph_rag.py --query "your_query_here" --root_dir . --method global.
- Sostituisci "your_query_here" con la domanda o la query che vuoi porre sui documenti.

GraphRAG utilizzerà ora il grafo della conoscenza creato durante il processo di indicizzazione per fornire risposte pertinenti e complete alle tue query, superando le tecniche tradizionali di generazione aumentata dal recupero.

Indicizzazione e configurazione di GraphRAG

Per iniziare con GraphRAG, dovrai seguire questi passaggi:

Installa i prerequisiti:
- Assicurati di avere Python installato sul tuo sistema.
- Installa Pip eseguendo il comando fornito nel tuo prompt dei comandi.
Clona il repository:
- Apri Visual Studio Code e crea una nuova finestra.
- Apri il terminale facendo clic sul pulsante di attivazione del pannello.
- Nel terminale, naviga nell'ambiente bash ed esegui il comando pip install graphrag per installare i pacchetti necessari.
Imposta l'ambiente:
- Nel terminale, digita cd graphrag per navigare nel repository clonato.
- Esporta la tua chiave API di OpenAI eseguendo il comando export GRAPHRAG_API_KEY=your_api_key_here.
Crea una cartella di input:
- Nel terminale, esegui il comando mkdir input per creare una cartella di input in cui posizionare i tuoi file o documenti.
- Apri la cartella in VS Code facendo clic su "File" > "Apri cartella" e selezionando il repository clonato.
Indicizza il documento:
- Posiziona il tuo documento (ad esempio, un report finanziario) nella cartella di input.
- Nel terminale, esegui il comando python dm_rrag index per indicizzare il documento corrente.
- Questo creerà un report della community sul documento indicizzato, che potrai ora utilizzare per chattare.
Configura l'ambiente:
- Nel file env, puoi configurare la chiave API, il tipo di modello e altre impostazioni.
- Puoi specificare l'utilizzo di un modello LLAMA o l'interfaccia OpenAI.
- Salva le modifiche al file env.
Esegui il codice:
- Nel terminale, esegui il comando python dm_rrag query --root_folder . --method global --query "your_query_here" per iniziare a chattare con il documento indicizzato.

Chattare con GraphRAG

Per chattare con GraphRAG, segui questi passaggi:

Dopo aver indicizzato il documento utilizzando il comando python dm_rrag index, puoi avviare la chat eseguendo il comando python dm_rrag query --root_folder . --method global "your query here".
Sostituisci "your query here" con la domanda o il prompt che vuoi porre a GraphRAG sul documento indicizzato.
GraphRAG utilizzerà quindi il grafo della conoscenza creato durante il processo di indicizzazione per fornire una risposta pertinente e informativa, sfruttando la potenza dei grandi modelli linguistici e le informazioni strutturate nel grafo della conoscenza.
Puoi continuare a chattare con GraphRAG eseguendo lo stesso comando con diverse query. Il sistema utilizzerà il grafo della conoscenza esistente per fornire risposte adattate alle tue domande.
Se vuoi passare a un modello linguistico diverso, puoi configurarlo nel file .env specificando LLM_TYPE e fornendo l'endpoint API appropriato o il percorso del modello locale.
L'approccio olistico di GraphRAG alla generazione aumentata dal recupero gli consente di superare le tecniche RAG di base, soprattutto per set di dati complessi o privati, connettendo parti di informazioni disparate e fornendo intuizioni sintetizzate.

FAQ

Cos'è RAG?

Qual è la differenza tra Graph RAG e i sistemi RAG di base tradizionali?

Come posso iniziare con Graph RAG?

Quali sono i vantaggi dell'utilizzo di Graph RAG?

Crea la tua ragazza AI

Costruisci il tuo compagno ideale con il nostro costruttore di fidanzate AI