LightRAG 入门指南：手把手教你用图增强 RAG 系统

发布时间：2026/5/28 4:03:09

LightRAG 入门指南手把手教你用图增强 RAG 系统一、LightRAG 是什么二、核心原理解析2.1 双层索引架构2.2 实体与关系抽取2.3 四种检索模式三、快速安装与配置3.1 安装3.2 使用 OpenAI API 配置国际版3.3 国内用户推荐方案四、完整使用教程4.1 文档插入4.2 四种模式查询对比4.3 异步查询生产环境推荐五、进阶技巧5.1 批量文档插入5.2 增量更新索引5.3 可视化知识图谱5.4 调整实体抽取粒度六、LightRAG vs 传统 RAG vs GraphRAG七、总结与推荐场景推荐使用 LightRAG 的场景暂时不适合的场景资源汇总LightRAG 入门指南手把手教你用图增强 RAG 系统你有没有遇到过这样的问题明明把文档喂给了 RAG 系统但问一个需要全局理解的问题比如这份合同的整体风险点在哪里得到的回答却是东一块西一块像是从文档里随机摘出来的句子拼凑的这就是传统 RAG 的核心痛点——它本质上是碎片化检索靠的是向量相似度匹配擅长找局部相关段落却对文档的整体结构和实体关系一无所知。LightRAG就是为了解决这个问题而生的。它把知识图谱Knowledge Graph引入 RAG 架构让系统不仅能找段落还能理关系、“懂全局”。一、LightRAG 是什么LightRAG是香港大学于 2024 年发布的一个开源 RAG 框架核心思想是将知识图谱与向量检索结合构建一套双层索引的检索增强生成系统。项目一经发布便迅速走红截至 2025 年初 GitHub Star 数已突破10,000是目前图增强 RAG 领域最受关注的开源项目之一。GitHub 地址https://github.com/HKUDS/LightRAG你可能听说过微软的GraphRAG同样是图RAG 的思路但两者定位差异明显GraphRAG功能强大但构建索引耗时极长几百页文档可能要跑几十分钟API 调用成本高部署复杂。LightRAG更轻量索引速度更快架构更简洁个人开发者和小团队可以直接上手同时也支持本地模型对国内用户更友好。作者提示LightRAG 的 “Light” 不是说功能弱而是说它在保留图谱理解能力的前提下把工程复杂度降到了最低。二、核心原理解析在动手之前花 5 分钟理解 LightRAG 的工作原理会让你在后续使用中少走很多弯路。2.1 双层索引架构LightRAG 在文档插入时会同时构建两种索引原始文档 │ ├──► [LLM 抽取] ──► 实体Entity 关系Relation──► 图索引Graph Index │ └──► [Embedding] ──► 语义向量 ──► 向量索引Vector Index向量索引和传统 RAG 一样把文本切块后做 Embedding用于语义相似度检索。图索引由 LLM 从文本中抽取实体人、地点、概念、组织等和它们之间的关系构建成一张知识图谱存储在本地图数据库中。2.2 实体与关系抽取这是 LightRAG 的核心步骤也是它比传统 RAG 聪明的关键。举个例子对于这段文本“查尔斯·达内是一位法国贵族他后来放弃了头衔与露西·曼内特结婚。”LightRAG 会抽取出实体查尔斯·达内人物、法国贵族身份、露西·曼内特人物关系查尔斯·达内 --[放弃]– 贵族头衔查尔斯·达内 --[结婚于]– 露西·曼内特这些关系最终构成图谱让系统在检索时能够沿着关系链条进行推理而不只是找语义相似的片段。2.3 四种检索模式LightRAG 提供了四种查询模式适合不同类型的问题模式检索策略适合问题类型naive纯向量相似度检索简单事实查找local以实体为中心的局部图谱检索特定人物/概念的详细信息global全图关系主题检索跨实体的宏观主题分析hybrid向量局部全局融合复杂推理、综合分析推荐简单理解问某个人做了什么 →local效果好问整篇文档的核心主题是什么 →global更合适不确定用哪个用hybrid准没错三、快速安装与配置3.1 安装pipinstalllightrag-hku安装完成后核心依赖会自动拉取包括图数据库客户端和 Embedding 工具。3.2 使用 OpenAI API 配置国际版importosfromlightragimportLightRAG,QueryParamfromlightrag.llmimportgpt_4o_mini_complete# 设置工作目录索引和图谱数据都存在这里WORKING_DIR./my_rag_projectos.makedirs(WORKING_DIR,exist_okTrue)# 设置 OpenAI API Keyos.environ[OPENAI_API_KEY]your-api-key-here# 初始化 LightRAGragLightRAG(working_dirWORKING_DIR,llm_model_funcgpt_4o_mini_complete# 也可以换成 gpt_4o_complete)3.3 国内用户推荐方案如果你在国内直接用 OpenAI API 可能不方便有两条路可以走方案 A使用 Ollama 本地模型完全免费不需要联网先安装 Ollama 并拉取模型ollama pull qwen2.5:7b ollama pull nomic-embed-text然后配置 LightRAGfromlightragimportLightRAG,QueryParamfromlightrag.llmimportollama_model_complete,ollama_embeddingfromlightrag.utilsimportEmbeddingFunc WORKING_DIR./my_rag_projectragLightRAG(working_dirWORKING_DIR,llm_model_funcollama_model_complete,llm_model_nameqwen2.5:7b,# 使用本地 Qwen 模型llm_model_kwargs{host:http://localhost:11434,# Ollama 默认地址options:{num_ctx:32768},},embedding_funcEmbeddingFunc(embedding_dim768,max_token_size8192,funclambdatexts:ollama_embedding(texts,embed_modelnomic-embed-text,hosthttp://localhost:11434),),)方案 B使用 DeepSeek API低成本云端方案DeepSeek 兼容 OpenAI 的 API 格式配置非常简单importosfromlightragimportLightRAG,QueryParamfromlightrag.llmimportopenai_complete_if_cache,openai_embeddingfromlightrag.utilsimportEmbeddingFunc os.environ[DEEPSEEK_API_KEY]your-deepseek-keyasyncdefdeepseek_complete(prompt,system_promptNone,history_messages[],**kwargs):returnawaitopenai_complete_if_cache(deepseek-chat,prompt,system_promptsystem_prompt,history_messageshistory_messages,api_keyos.environ[DEEPSEEK_API_KEY],base_urlhttps://api.deepseek.com/v1,**kwargs,)ragLightRAG(working_dirWORKING_DIR,llm_model_funcdeepseek_complete,embedding_funcEmbeddingFunc(embedding_dim1536,max_token_size8192,funclambdatexts:openai_embedding(texts,modeltext-embedding-3-small,api_keyos.environ[OPENAI_API_KEY],),),)注意DeepSeek 目前没有官方的 Embedding 接口建议 Embedding 部分使用nomic-embed-textOllama或text-embedding-3-smallOpenAI。两者混用完全没问题。四、完整使用教程下面用《双城记》A Tale of Two Cities作为示例文本带你走完完整流程。这也是 LightRAG 官方 demo 使用的数据集非常适合展示图谱的关系理解能力。4.1 文档插入withopen(./book.txt,r,encodingutf-8)asf:contentf.read()# 插入文档LightRAG 会自动完成# 1. 文本切块# 2. 实体/关系抽取LLM 驱动# 3. 构建向量索引和图索引rag.insert(content)print(文档插入完成)插入过程中你会看到控制台输出 LLM 正在逐块处理文本抽取实体和关系。对于一部完整的小说这个过程可能需要几分钟取决于模型速度和文档大小。工作目录下会生成以下文件my_rag_project/ ├── graph_chunk_entity_relation.graphml # 知识图谱文件 ├── kv_store_full_docs.json # 原始文档存储 ├── kv_store_text_chunks.json # 切块后的文本 ├── kv_store_llm_response_cache.json # LLM 响应缓存节省 API 费用 └── vdb_entities.json # 向量索引4.2 四种模式查询对比我们用同一个问题来对比四种模式的差异问题“What are the main themes of the story?”故事的主要主题是什么questionWhat are the main themes of the story?# Naive 模式 —— 纯向量检索print(*50)print([Naive 模式])print(rag.query(question,paramQueryParam(modenaive)))# Local 模式 —— 实体中心检索print(*50)print([Local 模式])print(rag.query(question,paramQueryParam(modelocal)))# Global 模式 —— 全局关系检索print(*50)print([Global 模式])print(rag.query(question,paramQueryParam(modeglobal)))# Hybrid 模式 —— 混合检索推荐print(*50)print([Hybrid 模式])print(rag.query(question,paramQueryParam(modehybrid)))实际输出对比简化版模式回答特点示例输出摘要naive引用了几段原文但缺乏整体分析“The story mentions resurrection, sacrifice, and the French Revolution…”local集中在具体人物的主题体现上“Sydney Carton’s arc represents self-sacrifice. Lucie Manette symbolizes…”global从关系网络中提炼宏观主题“The overarching themes are: 1) Resurrection and redemption… 2) The cycle of violence…”hybrid结合局部细节与全局脉络最为完整综合了以上所有角度给出了有逻辑层次的分析可以明显看出对于主题分析这类需要全局理解的问题global和hybrid的回答质量远超naive。4.3 异步查询生产环境推荐importasyncioasyncdefmain():resultawaitrag.aquery(Describe the relationship between Sydney Carton and Charles Darnay.,paramQueryParam(modehybrid))print(result)asyncio.run(main())五、进阶技巧5.1 批量文档插入importos docs[]forfilenameinos.listdir(./documents):iffilename.endswith(.txt):withopen(f./documents/{filename},r,encodingutf-8)asf:docs.append(f.read())# 批量插入内部会并发处理rag.insert(docs)5.2 增量更新索引LightRAG 天然支持增量更新——直接 insert 新文档即可已有的图谱不会被覆盖新的实体和关系会被合并进去# 插入新文档自动合并到现有知识图谱withopen(./new_document.txt,r,encodingutf-8)asf:rag.insert(f.read())5.3 可视化知识图谱LightRAG 会把知识图谱存为标准的.graphml格式可以用多种工具可视化方法 A使用 Gephi免费桌面软件直接打开graph_chunk_entity_relation.graphml文件即可看到实体关系网络图。方法 B使用 Python networkximportnetworkxasnximportmatplotlib.pyplotasplt Gnx.read_graphml(./my_rag_project/graph_chunk_entity_relation.graphml)print(f节点数实体:{G.number_of_nodes()})print(f边数关系:{G.number_of_edges()})plt.figure(figsize(12,8))nx.draw_spring(G,with_labelsTrue,node_size50,font_size6)plt.savefig(knowledge_graph.png,dpi150)plt.show()方法 C接入 Neo4j生产级图数据库ragLightRAG(working_dirWORKING_DIR,llm_model_funcgpt_4o_mini_complete,graph_storageNeo4JStorage,addon_params{neo4j_url:bolt://localhost:7687,neo4j_auth:(neo4j,your_password),})5.4 调整实体抽取粒度ragLightRAG(working_dirWORKING_DIR,llm_model_funcgpt_4o_mini_complete,addon_params{entity_types:[organization,person,location,concept,event],})作者提示对于专业领域文档如法律、医疗建议自定义entity_types加入领域专属实体类型如legal_term、disease能显著提升图谱质量。六、LightRAG vs 传统 RAG vs GraphRAG维度传统 RAGGraphRAG微软LightRAG检索方式向量相似度图谱社区遍历向量图谱融合全局理解能力弱强强局部细节检索强中强索引构建速度快很慢较快推理/查询速度快慢快API 调用成本低高中部署复杂度低高低本地模型支持支持有限原生支持适用场景FAQ、片段检索超大规模复杂知识库通用场景强烈推荐结论如果你是个人开发者或中小团队LightRAG 是目前性价比最高的图增强 RAG 方案。GraphRAG 更适合有充足预算和算力的大型企业知识库项目。七、总结与推荐场景推荐使用 LightRAG 的场景法律文书分析合同条款之间的引用关系、义务主体的关联梳理医疗文献研究疾病-症状-药物之间的关系图谱构建技术文档问答API 文档、架构文档中跨模块的概念关联小说/剧本分析人物关系、情节脉络、主题提炼企业知识库员工手册、流程文档、历史决策记录的智能检索研究论文助手多篇论文的观点对比与关联分析暂时不适合的场景实时数据图谱构建有一定延迟不适合需要秒级更新的实时信息流结构化数据库查询如果你的数据本来就是表格形式Text-to-SQL 方案更合适超大规模文档库亿级此量级建议考虑专业的图数据库企业级 RAG 架构资源汇总GitHub 项目主页https://github.com/HKUDS/LightRAG官方论文arXivLightRAG: Simple and Fast Retrieval-Augmented Generation官方示例代码https://github.com/HKUDS/LightRAG/tree/main/examplesLightRAG 代表了 RAG 技术演进的一个重要方向——从找段落到懂关系从碎片化匹配到结构化理解。如果你在做任何涉及复杂知识关联的 AI 应用强烈建议把 LightRAG 纳入你的技术选型清单。动手跑一遍你会发现图增强的力量。博客主页https://xiaoy.blog.csdn.net 本文由呆呆敲代码的小Y原创学习专栏推荐Unity系统学习专栏游戏制作专栏推荐游戏制作Unity实战100例专栏推荐Unity 实战100例教程欢迎点赞收藏 ⭐留言如有错误敬请指正未来很长值得我们全力奔赴更美好的生活✨------------------❤️分割线❤️-------------------------资料白嫖技术互助学习路线指引点击解锁知识定位人群定位 Unity系统学习专栏入门级本专栏从Unity入门开始学习快速达到Unity的入门水平 Unity实战类项目进阶级计划制作Unity的 100个实战案例助你进入Unity世界争取做最全的Unity原创博客大全。❤️ 游戏制作专栏难度偏高分享学习一些Unity成品的游戏Demo和其他语言的小游戏游戏爱好者万人社区互助/吹水数万人游戏爱好者社区聊天互助白嫖奖品 Unity100个实用技能Unity查漏补缺针对一些Unity中经常用到的一些小知识和技能进行学习介绍核心目的就是让我们能够快速学习Unity的知识以达到查漏补缺

第6篇_Retain_Will_KeepAlive_工业现场为什么不能只会转发PUBLISH

一个 Broker 会转发 PUBLISH，只能说明它能跑通“实时消息”。但工业现场还会问：新客户端上线后，能不能马上拿到设备当前状态？设备异常掉线，其他客户端能不能收到通知？客户端死了不发包，Broker 会…

2026/5/28 4:01:08 阅读更多

数字隔离器的用途和技术指标有哪些

数字隔离器是一种基于半导体工艺（如电容耦合、磁耦合或智能分压技术）的电气隔离器件，用于在不同电位的电路之间安全传输数字信号，同时阻断直流和有害交流电流、抑制噪声与地环路干扰。---主要用途- 电气安全隔离：在高压…

2026/5/28 3:59:47 阅读更多

可视挖耳勺多少像素够用？可视耳勺好用吗？可视耳勺使用方法

不少入手过低劣可视挖耳勺的朋友，都会纠结这类产品究竟是不是智商税。画面模糊卡顿、勺体硬磨耳道、续航转瞬即逝、WiFi频繁断连、镜头发热严重，糟糕的使用体验让人直呼踩坑。但实际上，优质可视挖耳勺和普通传统挖耳工具相比，安全…

2026/5/28 3:58:46 阅读更多

Claude代码助手14项配置优化：从配置地狱到10分钟高效开发环境

1. 项目概述：为什么Claude的配置优化如此重要？如果你和我一样，每天都要和Claude打交道，处理代码、调试脚本、分析数据，那你一定经历过那种“配置地狱”——每次打开一个新项目，或者换一台机器，都…

2026/5/28 4:58:43 阅读更多

如何配置Qwen3.5-397B-A17B多节点部署：分布式推理实战指南

如何配置Qwen3.5-397B-A17B多节点部署：分布式推理实战指南【免费下载链接】Qwen3.5 项目地址: https://ai.gitcode.com/hf_mirrors/vLLM_Ascend/Qwen3.5 想要在多个Ascend NPU节点上部署3970亿参数的Qwen3.5-A17B模型吗？这篇完整的分布式推理实…

2026/5/28 4:58:23 阅读更多

世外桃源的故事——《文字定律》随笔

第一幕故事讲的是很久很久以前，有一个风调雨顺的世外桃源之地生活着一群人。他们日出而作日入而息，过着耕种的生活。每当村子有大事发生，全村人都聚在一起，红事同喜，白事共丧。春天他们每家每户将种子播下地&#xff0…

2026/5/28 4:58:03 阅读更多

winform4

json using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Linq; using System.Text; using System.Threading.Tasks; using System.Windows.Forms; //导入json第三方库使用nuget搜索 …

2026/5/28 4:56:22 阅读更多

idea配置及插件

设置打开idea选择项目界面 idea工具设置(代码规约) 引入依赖时如图设置成9999 部署图注释代码如图设置部署图内容换行统一格式往前添加部署图格式化快捷键设置 File → Settings → Keymap ，搜索 Reformat Code ，右键修改快捷键（…

2026/5/28 4:56:22 阅读更多

4399小游戏里的大学问：拆解‘Domino逻辑数字’与‘数邻’的算法内核与在线实现

4399小游戏里的大学问：拆解‘Domino逻辑数字’与‘数邻’的算法内核与在线实现在数字解谜游戏的世界里，Domino逻辑数字和数邻这类游戏以其简洁的规则和丰富的策略性吸引了大量玩家。这些看似简单的游戏背后，隐藏着精妙的算法设计和数学原理。…

2026/5/28 4:56:02 阅读更多

大模型核心加速器：KV Cache 如何将 O(n²) 计算复杂度降至 O(n)？

KV Cache 是大模型自回归生成任务的关键优化技术，通过“空间换时间”策略缓存历史 Key 和 Value 向量，将推理复杂度从 O(n) 降至 O(n)。文章阐述了语义缓存与前缀精确匹配两种核心范式，深入分析了 KV Cache 的技术底层原理、工程化应用及规模…

2026/5/28 0:00:48 阅读更多

物流系统如何打通信息孤岛？哲盟软件系统：一键打通内外部数据壁垒

在数字化转型加速的今天，物流企业面临的最大痛点之一就是信息孤岛——ERP、电商平台、智能硬件、OMS/TMS/WMS等系统各自为政，数据无法自由流转，导致人工操作繁琐、效率低下、出错率高。特别是在跨境物流领域，亚马逊、Shopee、TikT…

2026/5/28 0:02:48 阅读更多

Windows Defender终极恢复指南：5种强力方法解决禁用问题

Windows Defender终极恢复指南：5种强力方法解决禁用问题【免费下载链接】no-defender A slightly more fun way to disable windows defender firewall. (through the WSC api) 项目地址: https://gitcode.com/GitHub_Trending/no/no-defender 当你的Windo…

2026/5/28 0:04:54 阅读更多

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

更多请点击： https://codechina.net 第一章：施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录在华北某大型地铁盾构施工现场，一套轻量化AI Agent系统于2024年Q2完成全栈部署&#xff…

2026/5/28 4:33:02 阅读更多

附录 B：术语表

本术语表面向“从 MM 到 HMM”专栏阅读过程中的快速查阅。它不是内核 API 手册，而是把文章中反复出现的概念放到同一张地图上：先给出直观含义，再说明它在 Linux MM/HMM 语境里的作用。建议阅读方式： 初读专栏时，把它当…

2026/5/28 3:32:24 阅读更多

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…

2026/5/28 3:32:25 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/27 20:16:23 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/27 15:51:09 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/27 12:55:08 阅读更多

相关文章