Sfrutta il potere di Graph RAG: sblocca i dati non strutturati con la ricerca semantica, gli embedding e molto altro
Sblocca il potere di Graph RAG per la ricerca semantica, l'estrazione di informazioni e l'analisi avanzata dei dati. Esplora questo framework di generazione potenziata dal recupero open-source che sfrutta i grafi della conoscenza per migliorare i modelli di linguaggio su larga scala. Migliora accuratezza e rilevanza per query complesse.
15 febbraio 2025

Sblocca il potere della ricerca semantica, degli embedding e della ricerca vettoriale con GraphRAG - il motore RAG open-source definitivo di Microsoft AI. Scopri come questa soluzione innovativa può trasformare le tue capacità di analisi dei dati e di risposta alle domande, offrendo informazioni più pertinenti e affidabili.
Cos'è RAG (Retrieval Augmented Generation)?
In che modo GraphRAG è diverso dai sistemi RAG tradizionali?
Iniziare con GraphRAG
Indicizzazione e configurazione di GraphRAG
Chattare con GraphRAG
Cos'è RAG (Retrieval Augmented Generation)?
Cos'è RAG (Retrieval Augmented Generation)?
RAG (Retrieval Augmented Generation) è un approccio utilizzato per migliorare i grandi modelli linguistici esistenti incorporando conoscenze esterne. L'idea chiave dietro RAG è di combinare la potenza dei grandi modelli linguistici con la capacità di recuperare e sfruttare informazioni rilevanti da fonti esterne, come basi di conoscenza o corpora di testi.
I principali vantaggi dell'approccio RAG sono:
-
Maggiore rilevanza: Recuperando e incorporando informazioni rilevanti, RAG può fornire risposte più accurate e pertinenti, soprattutto per domande che richiedono conoscenze specifiche.
-
Riduzione delle allucinazioni: È stato dimostrato che RAG riduce la tendenza dei grandi modelli linguistici a generare contenuti allucinati o inesatti dal punto di vista fattuale, poiché le risposte sono ancorate alle informazioni recuperate.
-
Versatilità: Oltre alla risposta alle domande, RAG può essere applicato a vari compiti di NLP come l'estrazione di informazioni, la raccomandazione, l'analisi del sentiment e il riassunto.
-
Gestione di dati privati: RAG può funzionare con set di dati privati o sensibili, poiché le informazioni vengono elaborate e memorizzate localmente, senza la necessità di condividere i dati con servizi esterni.
In che modo GraphRAG è diverso dai sistemi RAG tradizionali?
In che modo GraphRAG è diverso dai sistemi RAG tradizionali?
GraphRAG rappresenta un notevole progresso rispetto ai sistemi RAG (Retrieval Augmented Generation) tradizionali. Ecco come si differenzia:
-
Estrazione del grafo della conoscenza: A differenza del semplice recupero basato su testo, GraphRAG combina l'estrazione di testo, l'analisi di rete e il prompting del modello linguistico per costruire un grafo della conoscenza completo dai dati di input. Ciò consente una comprensione più profonda e olistica del contenuto.
-
Maggiore accuratezza e rilevanza: Sfruttando il grafo della conoscenza, GraphRAG può fornire risposte più accurate e pertinenti, soprattutto per set di dati complessi o specializzati. L'approccio basato sul grafo aiuta a connettere parti di informazioni disparate e a sintetizzare intuizioni che superano le tecniche RAG di base.
-
Comprensione olistica dei dati: GraphRAG segue un approccio più completo, migliorando la comprensione e il riassunto complessivi di grandi raccolte di dati. Ciò lo rende una scelta superiore per sfruttare i grandi modelli linguistici in compiti avanzati di analisi dei dati e risposta alle domande.
-
Riduzione delle allucinazioni: È stato dimostrato che GraphRAG riduce le tendenze dei grandi modelli linguistici a generare contenuti "allucinati" che non sono ancorati alle informazioni fornite. L'approccio basato sul grafo aiuta il modello a aderire più strettamente alle informazioni affidabili nel contesto.
-
Versatilità: Oltre alla risposta alle domande, GraphRAG può essere applicato a una varietà di compiti di elaborazione del linguaggio naturale, come l'estrazione di informazioni, le raccomandazioni, l'analisi del sentiment e il riassunto, tutto in un ambiente di archiviazione privato e locale.
Iniziare con GraphRAG
Iniziare con GraphRAG
Per iniziare con GraphRAG, segui questi passaggi:
-
Installa i prerequisiti:
- Assicurati di avere Python installato sul tuo sistema.
- Installa i pacchetti richiesti eseguendo
pip install graphrag
nel tuo terminale o prompt dei comandi.
-
Clona il repository:
- Apri Visual Studio Code (o il tuo IDE preferito) e crea una nuova cartella per il progetto.
- Nel terminale, naviga nella cartella del progetto ed esegui
git clone https://github.com/microsoft/graph-rag.git
per clonare il repository GraphRAG.
-
Imposta l'ambiente:
- Nel terminale, naviga nella directory
graph-rag
. - Esporta la tua chiave API di OpenAI eseguendo
export GRAPHRAG_API_KEY=your_api_key_here
.
- Nel terminale, naviga nella directory
-
Crea una cartella di input:
- Nel terminale, esegui
mkdir input
per creare una cartella di input per i tuoi documenti.
- Nel terminale, esegui
-
Indicizza i documenti:
- Posiziona i tuoi documenti (ad esempio, file di testo, PDF) nella cartella
input
. - Nel terminale, esegui
python dm_rag_index.py
per indicizzare i documenti.
- Posiziona i tuoi documenti (ad esempio, file di testo, PDF) nella cartella
-
Chatta con i documenti:
- Nel terminale, esegui
python dm_graph_rag.py --query "your_query_here" --root_dir . --method global
. - Sostituisci
"your_query_here"
con la domanda o la query che vuoi porre sui documenti.
- Nel terminale, esegui
GraphRAG utilizzerà ora il grafo della conoscenza creato durante il processo di indicizzazione per fornire risposte pertinenti e complete alle tue query, superando le tecniche tradizionali di generazione aumentata dal recupero.
Indicizzazione e configurazione di GraphRAG
Indicizzazione e configurazione di GraphRAG
Per iniziare con GraphRAG, dovrai seguire questi passaggi:
-
Installa i prerequisiti:
- Assicurati di avere Python installato sul tuo sistema.
- Installa Pip eseguendo il comando fornito nel tuo prompt dei comandi.
-
Clona il repository:
- Apri Visual Studio Code e crea una nuova finestra.
- Apri il terminale facendo clic sul pulsante di attivazione del pannello.
- Nel terminale, naviga nell'ambiente bash ed esegui il comando
pip install graphrag
per installare i pacchetti necessari.
-
Imposta l'ambiente:
- Nel terminale, digita
cd graphrag
per navigare nel repository clonato. - Esporta la tua chiave API di OpenAI eseguendo il comando
export GRAPHRAG_API_KEY=your_api_key_here
.
- Nel terminale, digita
-
Crea una cartella di input:
- Nel terminale, esegui il comando
mkdir input
per creare una cartella di input in cui posizionare i tuoi file o documenti. - Apri la cartella in VS Code facendo clic su "File" > "Apri cartella" e selezionando il repository clonato.
- Nel terminale, esegui il comando
-
Indicizza il documento:
- Posiziona il tuo documento (ad esempio, un report finanziario) nella cartella di input.
- Nel terminale, esegui il comando
python dm_rrag index
per indicizzare il documento corrente. - Questo creerà un report della community sul documento indicizzato, che potrai ora utilizzare per chattare.
-
Configura l'ambiente:
- Nel file
env
, puoi configurare la chiave API, il tipo di modello e altre impostazioni. - Puoi specificare l'utilizzo di un modello LLAMA o l'interfaccia OpenAI.
- Salva le modifiche al file
env
.
- Nel file
-
Esegui il codice:
- Nel terminale, esegui il comando
python dm_rrag query --root_folder . --method global --query "your_query_here"
per iniziare a chattare con il documento indicizzato.
- Nel terminale, esegui il comando
Chattare con GraphRAG
Chattare con GraphRAG
Per chattare con GraphRAG, segui questi passaggi:
-
Dopo aver indicizzato il documento utilizzando il comando
python dm_rrag index
, puoi avviare la chat eseguendo il comandopython dm_rrag query --root_folder . --method global "your query here"
. -
Sostituisci
"your query here"
con la domanda o il prompt che vuoi porre a GraphRAG sul documento indicizzato. -
GraphRAG utilizzerà quindi il grafo della conoscenza creato durante il processo di indicizzazione per fornire una risposta pertinente e informativa, sfruttando la potenza dei grandi modelli linguistici e le informazioni strutturate nel grafo della conoscenza.
-
Puoi continuare a chattare con GraphRAG eseguendo lo stesso comando con diverse query. Il sistema utilizzerà il grafo della conoscenza esistente per fornire risposte adattate alle tue domande.
-
Se vuoi passare a un modello linguistico diverso, puoi configurarlo nel file
.env
specificandoLLM_TYPE
e fornendo l'endpoint API appropriato o il percorso del modello locale. -
L'approccio olistico di GraphRAG alla generazione aumentata dal recupero gli consente di superare le tecniche RAG di base, soprattutto per set di dati complessi o privati, connettendo parti di informazioni disparate e fornendo intuizioni sintetizzate.
FAQ
FAQ