Раскройте силу Graph RAG: разблокируйте неструктурированные данные с помощью семантического поиска, встраиваний и многого другого
Раскройте силу Graph RAG для семантического поиска, извлечения информации и углубленного анализа данных. Исследуйте эту открытую платформу для генерации с расширенным поиском, которая использует знаниевые графы для улучшения крупных языковых моделей. Повысьте точность и актуальность для сложных запросов.
14 февраля 2025 г.

Раскройте силу семантического поиска, встраиваний и векторного поиска с помощью GraphRAG - ведущего открытого движка RAG от Microsoft AI. Узнайте, как это инновационное решение может преобразить ваши возможности анализа данных и ответов на вопросы, обеспечивая более актуальные и надежные инсайты.
Что такое RAG (Retrieval Augmented Generation)?
Чем GraphRAG отличается от традиционных систем RAG?
Начало работы с GraphRAG
Индексация и настройка GraphRAG
Общение с GraphRAG
Что такое RAG (Retrieval Augmented Generation)?
Что такое RAG (Retrieval Augmented Generation)?
RAG (Retrieval Augmented Generation) - это подход, используемый для улучшения существующих крупных языковых моделей путем включения внешних знаний. Ключевая идея за RAG - это сочетание мощи крупных языковых моделей со способностью извлекать и использовать соответствующую информацию из внешних источников, таких как базы знаний или текстовые корпусы.
Основные преимущества подхода RAG:
-
Улучшенная актуальность: Извлекая и включая соответствующую информацию, RAG может обеспечить более точные и актуальные ответы, особенно на вопросы, требующие конкретных знаний.
-
Снижение галлюцинаций: Было показано, что RAG снижает тенденцию крупных языковых моделей к генерации галлюцинированного или фактически неверного контента, поскольку ответы основаны на извлеченной информации.
-
Универсальность: Помимо вопросно-ответной системы, RAG можно применять к различным задачам обработки естественного языка, таким как извлечение информации, рекомендации, анализ тональности и резюмирование.
-
Обработка частных данных: RAG может работать с частными или конфиденциальными наборами данных, так как информация обрабатывается и хранится локально, без необходимости передавать данные внешним службам.
Чем GraphRAG отличается от традиционных систем RAG?
Чем GraphRAG отличается от традиционных систем RAG?
GraphRAG - это значительное улучшение по сравнению с традиционными базовыми системами RAG (Retrieval Augmented Generation). Вот чем он отличается:
-
Извлечение знаний из графа: В отличие от простого текстового поиска, GraphRAG сочетает извлечение текста, анализ сетей и подсказки языковой модели для построения всеобъемлющего графа знаний из входных данных. Это позволяет достичь более глубокого и целостного понимания содержимого.
-
Повышенная точность и актуальность: Используя граф знаний, GraphRAG может обеспечить более точные и актуальные ответы, особенно для сложных или специализированных наборов данных. Графовый подход помогает связывать разрозненные части информации и синтезировать выводы, превосходящие базовые методы RAG.
-
Целостное понимание данных: GraphRAG следует более комплексному подходу, улучшая общее понимание и резюмирование больших коллекций данных. Это делает его более предпочтительным выбором для использования крупных языковых моделей в продвинутых задачах анализа данных и вопросно-ответных системах.
-
Снижение галлюцинаций: Было показано, что GraphRAG снижает тенденции крупных языковых моделей к генерации "галлюцинированного" контента, не основанного на предоставленной информации. Графовый подход помогает модели более точно придерживаться надежной информации в контексте.
-
Универсальность: Помимо вопросно-ответных систем, GraphRAG можно применять к различным задачам обработки естественного языка, таким как извлечение информации, рекомендации, анализ тональности и резюмирование, все в рамках частной локальной среды хранения.
Начало работы с GraphRAG
Начало работы с GraphRAG
Чтобы начать работу с GraphRAG, выполните следующие шаги:
-
Установите необходимые компоненты:
- Убедитесь, что у вас установлен Python на вашей системе.
- Установите необходимые пакеты, выполнив
pip install graphrag
в вашем терминале или командной строке.
-
Клонируйте репозиторий:
- Откройте Visual Studio Code (или предпочитаемую вами IDE) и создайте новую папку для проекта.
- В терминале перейдите в папку проекта и выполните
git clone https://github.com/microsoft/graph-rag.git
, чтобы клонировать репозиторий GraphRAG.
-
Настройте окружение:
- В терминале перейдите в директорию
graph-rag
. - Экспортируйте ваш ключ API OpenAI, выполнив
export GRAPHRAG_API_KEY=ваш_ключ_api_здесь
.
- В терминале перейдите в директорию
-
Создайте папку для входных данных:
- В терминале выполните
mkdir input
, чтобы создать папку для ваших документов.
- В терминале выполните
-
Индексируйте документы:
- Поместите ваши документы (например, текстовые файлы, PDF) в папку
input
. - В терминале выполните
python dm_rag_index.py
, чтобы проиндексировать документы.
- Поместите ваши документы (например, текстовые файлы, PDF) в папку
-
Общайтесь с документами:
- В терминале выполните
python dm_graph_rag.py --query "ваш_запрос_здесь" --root_dir . --method global
. - Замените
"ваш_запрос_здесь"
на вопрос или запрос, который вы хотите задать о документах.
- В терминале выполните
GraphRAG теперь будет использовать граф знаний, созданный во время процесса индексации, чтобы предоставить актуальные и всеобъемлющие ответы на ваши запросы, превосходя традиционные методы поиска с расширенной генерацией.
Индексация и настройка GraphRAG
Индексация и настройка GraphRAG
Чтобы начать работу с GraphRAG, вам нужно выполнить следующие шаги:
-
Установите необходимые компоненты:
- Убедитесь, что у вас установлен Python на вашей системе.
- Установите Pip, выполнив предоставленную команду в вашей командной строке.
-
Клонируйте репозиторий:
- Откройте Visual Studio Code и создайте новое окно.
- Откройте терминал, нажав на кнопку переключения панели.
- В терминале перейдите в bash-окружение и выполните команду
pip install graphrag
, чтобы установить необходимые пакеты.
-
Настройте окружение:
- В терминале введите
cd graphrag
, чтобы перейти в клонированный репозиторий. - Экспортируйте ваш ключ API OpenAI, выполнив команду
export GRAPHRAG_API_KEY=ваш_ключ_api_здесь
.
- В терминале введите
-
Создайте папку для входных данных:
- В терминале выполните команду
mkdir input
, чтобы создать папку для ваших файлов или документов. - Откройте папку в VS Code, нажав на "Файл" > "Открыть папку" и выбрав клонированный репозиторий.
- В терминале выполните команду
-
Индексируйте документ:
- Поместите ваш документ (например, финансовый отчет) в папку input.
- В терминале выполните команду
python dm_rrag index
, чтобы проиндексировать текущий документ. - Это создаст отчет о сообществе по проиндексированному документу, который вы можете использовать для общения.
-
Настройте окружение:
- В файле
env
вы можете настроить ключ API, тип модели и другие параметры. - Вы можете указать использование модели LLAMA или интерфейса OpenAI.
- Сохраните изменения в файле
env
.
- В файле
-
Запустите код:
- В терминале выполните команду
python dm_rrag query --root_folder . --method global --query "ваш_запрос_здесь"
, чтобы начать общение с проиндексированным документом.
- В терминале выполните команду
Выполнив эти шаги, вы можете настроить GraphRAG, проиндексировать ваши документы и начать использовать возможности поиска с расширенной генерацией для улучшения задач обработки естественного языка.
Общение с GraphRAG
Общение с GraphRAG
Чтобы общаться с GraphRAG, выполните следующие шаги:
-
После индексации документа с помощью команды
python dm_rrag index
вы можете начать общение, выполнив командуpython dm_rrag query --root_folder . --method global "ваш запрос здесь"
. -
Замените
"ваш запрос здесь"
на вопрос или запрос, который вы хотите задать GraphRAG о проиндексированном документе. -
GraphRAG затем использует граф знаний, созданный во время процесса индексации, чтобы предоставить актуальный и информативный ответ, используя мощь крупных языковых моделей и структурированную информацию в графе знаний.
-
Вы можете продолжать общаться с GraphRAG, выполняя ту же команду с различными запросами. Система будет использовать существующий граф знаний, чтобы предоставлять ответы, адаптированные к вашим вопросам.
-
Если вы хотите переключиться на другую языковую модель, вы можете настроить ее в файле
.env
, указавLLM_TYPE
и предоставив соответствующую конечную точку API или путь к локальной модели. -
Целостный подход GraphRAG к поиску с расширенной генерацией позволяет ему превосходить традиционные базовые методы RAG, особенно для сложных или частных наборов данных, за счет связывания разрозненных частей информации и предоставления синтезированных выводов.
Часто задаваемые вопросы
Часто задаваемые вопросы

