Khai thác Sức mạnh của Graph RAG: Mở khóa Dữ liệu không cấu trúc với Tìm kiếm ngữ nghĩa, Nhúng và Nhiều hơn nữa
Mở khóa sức mạnh của Graph RAG để tìm kiếm ngữ nghĩa, trích xuất thông tin và phân tích dữ liệu nâng cao. Khám phá khung công tác tạo ra với sự hỗ trợ của truy xuất này, sử dụng các đồ thị tri thức để tăng cường các mô hình ngôn ngữ lớn. Tăng độ chính xác và tính liên quan cho các truy vấn phức tạp.
24 tháng 2, 2025

Mở khóa sức mạnh của tìm kiếm ngữ nghĩa, nhúng và tìm kiếm vector với GraphRAG - động cơ RAG nguồn mở tối ưu từ Microsoft AI. Khám phá cách giải pháp đổi mới này có thể biến đổi khả năng phân tích dữ liệu và trả lời câu hỏi của bạn, mang lại những hiểu biết liên quan và đáng tin cậy hơn.
RAG (Retrieval Augmented Generation) là gì?
GraphRAG khác với các hệ thống RAG truyền thống như thế nào?
Bắt đầu với GraphRAG
Lập chỉ mục và cấu hình GraphRAG
Trò chuyện với GraphRAG
RAG (Retrieval Augmented Generation) là gì?
RAG (Retrieval Augmented Generation) là gì?
RAG (Retrieval Augmented Generation) là một phương pháp được sử dụng để tăng cường các mô hình ngôn ngữ lớn hiện có bằng cách kết hợp kiến thức bên ngoài. Ý tưởng chính đằng sau RAG là kết hợp sức mạnh của các mô hình ngôn ngữ lớn với khả năng truy xuất và sử dụng thông tin liên quan từ các nguồn bên ngoài, chẳng hạn như cơ sở dữ liệu kiến thức hoặc tập hợp văn bản.
Các lợi ích chính của phương pháp RAG là:
-
Tăng cường Liên quan: Bằng cách truy xuất và kết hợp thông tin liên quan, RAG có thể cung cấp các phản hồi chính xác và liên quan hơn, đặc biệt là đối với các câu hỏi yêu cầu kiến thức cụ thể.
-
Giảm Ảo tưởng: RAG đã được chứng minh là giảm xu hướng của các mô hình ngôn ngữ lớn tạo ra nội dung ảo tưởng hoặc không chính xác về mặt sự thật, vì các phản hồi được dựa trên thông tin đã truy xuất.
-
Tính đa dạng: Ngoài việc trả lời câu hỏi, RAG có thể được áp dụng cho các nhiệm vụ NLP khác như trích xuất thông tin, đề xuất, phân tích cảm xúc và tóm tắt.
-
Xử lý Dữ liệu Riêng tư: RAG có thể hoạt động với các tập dữ liệu riêng tư hoặc nhạy cảm, vì thông tin được xử lý và lưu trữ tại chỗ, không cần chia sẻ dữ liệu với các dịch vụ bên ngoài.
GraphRAG khác với các hệ thống RAG truyền thống như thế nào?
GraphRAG khác với các hệ thống RAG truyền thống như thế nào?
GraphRAG là một bước tiến đáng kể so với các hệ thống RAG (Retrieval Augmented Generation) truyền thống. Đây là cách nó khác biệt:
-
Trích xuất Đồ thị Kiến thức: Không giống như việc truy xuất dựa trên văn bản đơn giản, GraphRAG kết hợp trích xuất văn bản với phân tích mạng và lời nhắc mô hình ngôn ngữ để xây dựng một đồ thị kiến thức toàn diện từ dữ liệu đầu vào. Điều này cho phép có một sự hiểu biết sâu sắc và toàn diện hơn về nội dung.
-
Tăng cường Độ chính xác và Liên quan: Bằng cách khai thác đồ thị kiến thức, GraphRAG có thể cung cấp các phản hồi chính xác và liên quan hơn, đặc biệt là đối với các tập dữ liệu phức tạp hoặc chuyên sâu. Phương pháp dựa trên đồ thị giúp kết nối các mảnh thông tin khác nhau và tổng hợp các hiểu biết vượt trội so với các kỹ thuật RAG cơ bản.
-
Hiểu biết Toàn diện về Dữ liệu: GraphRAG tuân theo một cách tiếp cận toàn diện hơn, tăng cường sự hiểu biết và tóm tắt chung của các bộ dữ liệu lớn. Điều này khiến nó trở thành một lựa chọn tốt hơn để khai thác các mô hình ngôn ngữ lớn trong các nhiệm vụ phân tích dữ liệu nâng cao và trả lời câu hỏi.
-
Giảm Ảo tưởng: GraphRAG đã được chứng minh là giảm các xu hướng của các mô hình ngôn ngữ lớn tạo ra nội dung "ảo tưởng" không dựa trên thông tin được cung cấp. Phương pháp dựa trên đồ thị giúp mô hình tuân thủ chặt chẽ hơn với thông tin đáng tin cậy trong ngữ cảnh.
-
Tính đa dạng: Ngoài việc trả lời câu hỏi, GraphRAG có thể được áp dụng cho nhiều tác vụ xử lý ngôn ngữ tự nhiên khác, chẳng hạn như trích xuất thông tin, đề xuất, phân tích cảm xúc và tóm tắt, tất cả trong một môi trường lưu trữ riêng tư tại chỗ.
Tóm lại, GraphRAG đại diện cho một bước tiến đáng kể trong lĩnh vực tạo ra thông tin được tăng cường bằng cách truy xuất, cung cấp độ chính xác, liên quan và hiểu biết toàn diện về dữ liệu, khiến nó trở thành một khuôn khổ mạnh mẽ để khai thác các mô hình ngôn ngữ lớn trong các ứng dụng nâng cao.
Bắt đầu với GraphRAG
Bắt đầu với GraphRAG
Để bắt đầu với GraphRAG, hãy làm theo các bước sau:
-
Cài đặt Các yêu cầu trước:
- Đảm bảo bạn đã cài đặt Python trên hệ thống của mình.
- Cài đặt các gói cần thiết bằng cách chạy
pip install graphrag
trong terminal hoặc dấu nhắc lệnh của bạn.
-
Nhân bản Kho lưu trữ:
- Mở Visual Studio Code (hoặc IDE ưa thích của bạn) và tạo một thư mục mới cho dự án.
- Trong terminal, điều hướng đến thư mục dự án và chạy
git clone https://github.com/microsoft/graph-rag.git
để nhân bản kho lưu trữ GraphRAG.
-
Thiết lập Môi trường:
- Trong terminal, điều hướng đến thư mục
graph-rag
. - Xuất khóa API OpenAI của bạn bằng cách chạy
export GRAPHRAG_API_KEY=your_api_key_here
.
- Trong terminal, điều hướng đến thư mục
-
Tạo Thư mục Đầu vào:
- Trong terminal, chạy
mkdir input
để tạo một thư mục đầu vào cho các tài liệu của bạn.
- Trong terminal, chạy
-
Lập chỉ mục các Tài liệu:
- Đặt các tài liệu của bạn (ví dụ: tệp văn bản, PDF) vào thư mục
input
. - Trong terminal, chạy
python dm_rag_index.py
để lập chỉ mục các tài liệu.
- Đặt các tài liệu của bạn (ví dụ: tệp văn bản, PDF) vào thư mục
-
Trò chuyện với các Tài liệu:
- Trong terminal, chạy
python dm_graph_rag.py --query "your_query_here" --root_dir . --method global
. - Thay thế
"your_query_here"
bằng câu hỏi hoặc truy vấn bạn muốn hỏi về các tài liệu.
- Trong terminal, chạy
GraphRAG sẽ sử dụng đồ thị kiến thức mà nó đã tạo trong quá trình lập chỉ mục để cung cấp các phản hồi liên quan và toàn diện cho các truy vấn của bạn, vượt trội hơn so với các kỹ thuật tạo ra thông tin được tăng cường bằng cách truy xuất truyền thống.
Lập chỉ mục và cấu hình GraphRAG
Lập chỉ mục và cấu hình GraphRAG
Để bắt đầu với GraphRAG, bạn cần phải làm theo các bước sau:
-
Cài đặt Các yêu cầu trước:
- Đảm bảo bạn đã cài đặt Python trên hệ thống của mình.
- Cài đặt Pip bằng cách chạy lệnh được cung cấp trong dấu nhắc lệnh của bạn.
-
Nhân bản Kho lưu trữ:
- Mở Visual Studio Code và tạo một cửa sổ mới.
- Mở terminal bằng cách nhấp vào nút chuyển đổi bảng điều khiển.
- Trong terminal, điều hướng đến môi trường bash và chạy lệnh
pip install graphrag
để cài đặt các gói cần thiết.
-
Thiết lập Môi trường:
- Trong terminal, gõ
cd graphrag
để điều hướng đến kho lưu trữ đã nhân bản. - Xuất khóa API OpenAI của bạn bằng cách chạy lệnh
export GRAPHRAG_API_KEY=your_api_key_here
.
- Trong terminal, gõ
-
Tạo Thư mục Đầu vào:
- Trong terminal, chạy lệnh
mkdir input
để tạo một thư mục đầu vào nơi bạn sẽ đặt các tệp hoặc tài liệu của mình. - Mở thư mục trong VS Code bằng cách nhấp vào "File" > "Open Folder" và chọn kho lưu trữ đã nhân bản.
- Trong terminal, chạy lệnh
-
Lập chỉ mục Tài liệu:
- Đặt tài liệu của bạn (ví dụ: một báo cáo tài chính) vào thư mục đầu vào.
- Trong terminal, chạy lệnh
python dm_rrag index
để lập chỉ mục tài liệu hiện tại. - Điều này sẽ tạo một báo cáo cộng đồng về tài liệu đã lập chỉ mục, mà bạn có thể sử dụng để trò chuyện.
-
Cấu hình Môi trường:
- Trong tệp
env
, bạn có thể cấu hình khóa API, loại mô hình và các cài đặt khác. - Bạn có thể chỉ định sử dụng mô hình LLAMA hoặc giao diện OpenAI.
- Lưu các thay đổi vào tệp
env
.
- Trong tệp
-
Chạy Mã:
- Trong terminal, chạy lệnh
python dm_rrag query --root_folder . --method global --query "your_query_here"
để bắt đầu trò chuyện với tài liệu đã lập chỉ mục.
- Trong terminal, chạy lệnh
Bằng cách làm theo các bước này, bạn có thể thiết lập GraphRAG, lập chỉ mục các tài liệu của mình và bắt đầu sử dụng các khả năng tạo ra thông tin được tăng cường bằng cách truy xuất để tăng cường các tác vụ xử lý ngôn ngữ tự nhiên của mình.
Trò chuyện với GraphRAG
Trò chuyện với GraphRAG
Để trò chuyện với GraphRAG, hãy làm theo các bước sau:
-
Sau khi lập chỉ mục tài liệu bằng lệnh
python dm_rrag index
, bạn có thể bắt đầu trò chuyện bằng cách chạy lệnhpython dm_rrag query --root_folder . --method global "your query here"
. -
Thay thế
"your query here"
bằng câu hỏi hoặc lời nhắc bạn muốn hỏi GraphRAG về tài liệu đã lập chỉ mục. -
GraphRAG sẽ sử dụng đồ thị kiến thức mà nó đã tạo trong quá trình lập chỉ mục để cung cấp một phản hồi liên quan và thông tin, khai thác sức mạnh của các mô hình ngôn ngữ lớn và thông tin có cấu trúc trong đồ thị kiến thức.
-
Bạn có thể tiếp tục trò chuyện với GraphRAG bằng cách chạy cùng lệnh với các truy vấn khác nhau. Hệ thống sẽ sử dụng đồ thị kiến thức hiện có để cung cấp các phản hồi phù hợp với các câu hỏi của bạn.
-
Nếu bạn muốn chuyển sang mô hình ngôn ngữ khác, bạn có thể cấu hình mô hình trong tệp
.env
bằng cách chỉ địnhLLM_TYPE
và cung cấp điểm cuối API hoặc đường dẫn mô hình cục bộ phù hợp. -
Cách tiếp cận toàn diện của GraphRAG đối với việc tạo ra thông tin được tăng cường bằng cách truy xuất cho phép nó vượt trội hơn so với các kỹ thuật RAG cơ bản truyền thống, đặc biệt là đối với các tập dữ liệu phức tạp hoặc riêng tư, bằng cách kết nối các mảnh thông tin khác nhau và cung cấp các hiểu biết được tổng hợp.
Câu hỏi thường gặp
Câu hỏi thường gặp

