Aproveite o Poder do Graph RAG: Desbloqueie Dados Não Estruturados com Pesquisa Semântica, Embeddings e Muito Mais

Desbloqueie o poder do Graph RAG para pesquisa semântica, extração de informações e análise de dados avançada. Explore esta estrutura de geração aumentada por recuperação de código aberto que aproveita os gráficos de conhecimento para melhorar os modelos de linguagem em larga escala. Aumente a precisão e a relevância para consultas complexas.

20 de fevereiro de 2025

Desbloqueie o poder da pesquisa semântica, embeddings e pesquisa vetorial com o GraphRAG - o motor RAG de código aberto definitivo da Microsoft AI. Descubra como essa solução inovadora pode transformar suas capacidades de análise de dados e resposta a perguntas, entregando insights mais relevantes e confiáveis.

O que é RAG (Retrieval Augmented Generation)?
Como o GraphRAG é diferente dos sistemas RAG tradicionais?
Começando com o GraphRAG
Indexação e configuração do GraphRAG
Conversando com o GraphRAG

O que é RAG (Retrieval Augmented Generation)?

RAG (Retrieval Augmented Generation) é uma abordagem usada para melhorar os modelos de linguagem existentes, incorporando conhecimento externo. A ideia-chave por trás do RAG é combinar o poder dos modelos de linguagem com a capacidade de recuperar e aproveitar informações relevantes de fontes externas, como bases de conhecimento ou corpora de texto.

Os principais benefícios da abordagem RAG são:

Melhoria da Relevância: Ao recuperar e incorporar informações relevantes, o RAG pode fornecer respostas mais precisas e relevantes, especialmente para perguntas que exigem conhecimento específico.
Redução da Alucinação: O RAG demonstrou reduzir a tendência dos modelos de linguagem de gerar conteúdo alucinado ou factualmente incorreto, pois as respostas são fundamentadas nas informações recuperadas.
Versatilidade: Além da resposta a perguntas, o RAG pode ser aplicado a várias tarefas de PLN, como extração de informações, recomendação, análise de sentimento e sumarização.
Manuseio de Dados Privados: O RAG pode trabalhar com conjuntos de dados privados ou sensíveis, pois as informações são processadas e armazenadas localmente, sem a necessidade de compartilhar os dados com serviços externos.

Como o GraphRAG é diferente dos sistemas RAG tradicionais?

O GraphRAG é um avanço significativo em relação aos sistemas RAG (Retrieval Augmented Generation) tradicionais. Veja como ele se diferencia:

Extração de Grafo de Conhecimento: Ao contrário da simples recuperação de texto, o GraphRAG combina extração de texto, análise de rede e prompting de modelos de linguagem para construir um grafo de conhecimento abrangente a partir dos dados de entrada. Isso permite uma compreensão mais profunda e holística do conteúdo.
Melhoria da Precisão e Relevância: Ao aproveitar o grafo de conhecimento, o GraphRAG pode fornecer respostas mais precisas e relevantes, especialmente para conjuntos de dados complexos ou especializados. A abordagem baseada em grafo ajuda a conectar peças de informação dispersas e sintetizar insights que superam as técnicas RAG básicas.
Compreensão Holística de Dados: O GraphRAG segue uma abordagem mais abrangente, melhorando a compreensão geral e a sumarização de grandes coleções de dados. Isso o torna uma escolha superior para aproveitar os modelos de linguagem em tarefas avançadas de análise de dados e resposta a perguntas.
Redução da Alucinação: O GraphRAG demonstrou reduzir as tendências dos modelos de linguagem de gerar conteúdo "alucinado" que não está fundamentado nas informações fornecidas. A abordagem baseada em grafo ajuda o modelo a aderir mais de perto às informações confiáveis no contexto.
Versatilidade: Além da resposta a perguntas, o GraphRAG pode ser aplicado a uma variedade de tarefas de processamento de linguagem natural, como extração de informações, recomendações, análise de sentimento e sumarização, tudo em um ambiente de armazenamento privado e local.

Começando com o GraphRAG

Para começar com o GraphRAG, siga estas etapas:

Instalar Pré-requisitos:
- Certifique-se de ter o Python instalado em seu sistema.
- Instale os pacotes necessários executando pip install graphrag no seu terminal ou prompt de comando.
Clonar o Repositório:
- Abra o Visual Studio Code (ou seu IDE preferido) e crie uma nova pasta para o projeto.
- No terminal, navegue até a pasta do projeto e execute git clone https://github.com/microsoft/graph-rag.git para clonar o repositório GraphRAG.
Configurar o Ambiente:
- No terminal, navegue até o diretório graph-rag.
- Exporte sua chave de API do OpenAI executando export GRAPHRAG_API_KEY=sua_chave_api_aqui.
Criar uma Pasta de Entrada:
- No terminal, execute mkdir input para criar uma pasta de entrada para seus documentos.
Indexar os Documentos:
- Coloque seus documentos (por exemplo, arquivos de texto, PDFs) na pasta input.
- No terminal, execute python dm_rag_index.py para indexar os documentos.
Conversar com os Documentos:
- No terminal, execute python dm_graph_rag.py --query "sua_consulta_aqui" --root_dir . --method global.
- Substitua "sua_consulta_aqui" pela pergunta ou consulta que você deseja fazer sobre os documentos.

O GraphRAG agora usará o grafo de conhecimento que criou durante o processo de indexação para fornecer respostas relevantes e abrangentes às suas consultas, superando as técnicas tradicionais de geração aumentada por recuperação.

Indexação e configuração do GraphRAG

Para começar com o GraphRAG, você precisará seguir estas etapas:

Instalar Pré-requisitos:
- Certifique-se de ter o Python instalado em seu sistema.
- Instale o Pip executando o comando fornecido no seu prompt de comando.
Clonar o Repositório:
- Abra o Visual Studio Code e crie uma nova janela.
- Abra o terminal clicando no botão de alternância do painel.
- No terminal, navegue até o ambiente bash e execute o comando pip install graphrag para instalar os pacotes necessários.
Configurar o Ambiente:
- No terminal, digite cd graphrag para navegar até o repositório clonado.
- Exporte sua chave de API do OpenAI executando o comando export GRAPHRAG_API_KEY=sua_chave_api_aqui.
Criar uma Pasta de Entrada:
- No terminal, execute o comando mkdir input para criar uma pasta de entrada onde você colocará seus arquivos ou documentos.
- Abra a pasta no VS Code clicando em "Arquivo" > "Abrir Pasta" e selecionando o repositório clonado.
Indexar o Documento:
- Coloque seu documento (por exemplo, um relatório financeiro) na pasta de entrada.
- No terminal, execute o comando python dm_rrag index para indexar o documento atual.
- Isso criará um relatório de comunidade sobre o documento indexado, que você pode usar para conversar.
Configurar o Ambiente:
- No arquivo env, você pode configurar a chave da API, o tipo de modelo e outras configurações.
- Você pode especificar o uso de um modelo LLAMA ou a interface do OpenAI.
- Salve as alterações no arquivo env.
Executar o Código:
- No terminal, execute o comando python dm_rrag query --root_folder . --method global --query "sua_consulta_aqui" para iniciar a conversa com o documento indexado.

Seguindo estas etapas, você pode configurar o GraphRAG, indexar seus documentos e começar a usar os recursos de geração aumentada por recuperação para melhorar suas tarefas de processamento de linguagem natural.

Conversando com o GraphRAG

Para conversar com o GraphRAG, siga estas etapas:

Depois de indexar o documento usando o comando python dm_rrag index, você pode iniciar a conversa executando o comando python dm_rrag query --root_folder . --method global "sua consulta aqui".
Substitua "sua consulta aqui" pela pergunta ou prompt que você deseja fazer ao GraphRAG sobre o documento indexado.
O GraphRAG então usará o grafo de conhecimento que criou durante o processo de indexação para fornecer uma resposta relevante e informativa, aproveitando o poder dos modelos de linguagem e as informações estruturadas no grafo de conhecimento.
Você pode continuar conversando com o GraphRAG executando o mesmo comando com diferentes consultas. O sistema usará o grafo de conhecimento existente para fornecer respostas adaptadas às suas perguntas.
Se você quiser mudar para um modelo de linguagem diferente, pode configurá-lo no arquivo .env especificando o LLM_TYPE e fornecendo o endpoint da API apropriado ou o caminho do modelo local.
A abordagem holística do GraphRAG para a geração aumentada por recuperação permite que ele supere as técnicas RAG básicas, especialmente para conjuntos de dados complexos ou privados, conectando peças de informação dispersas e fornecendo insights sintetizados.

Perguntas frequentes

O que é RAG?

Qual a diferença entre o Graph RAG e os sistemas de linha de base RAG tradicionais?

Como posso começar com o Graph RAG?

Quais são os benefícios de usar o Graph RAG?

Crie sua namorada com IA

Crie sua companheira ideal com nosso AI Girlfriend Builder