RAG 检索增强生成（全链路）

发布时间：2026/5/22 9:22:22

目录一、什么是RAG(Retrieval-augmented Generation)二、核心流程三、从零实战1. 环境准备2. 准备你的资料3. 代码4. 运行结果四、RAG全链路1. 文档切分切块2. Embedding 向量化3. 向量库存储4. 语义检索5. LLM生成回答必备5个工具全免费实操最容易踩的坑一、什么是RAG(Retrieval-augmented Generation)RAG 给大模型配个专属“参考书”模型不再瞎编而是先从你上传的文档里查答案再组织语言回复专治幻觉、不懂私域数据、知识过时。二、核心流程把你的文档PDF/TXT/MD切成小段转成向量存在本地库你提问 → 系统去库里找最相关的段落把段落问题丢给大模型 → 模型照着回答三、从零实战1. 环境准备装必备包一行命令pipinstalllangchain langchain-community chromadb sentence-transformers2. 准备你的资料新建一个info.txt内容如下本公司主营企业级软件开发与数字化咨询服务主要产品包括企业管理系统、数据可视化平台、智能客服系统三类。企业管理系统支持财务核算、人事管理、供应链协同功能适配生产制造、商贸流通、现代服务等行业。数据可视化平台可对接MySQL、PostgreSQL等主流数据库支持实时数据看板、多维度报表分析。智能客服系统具备意图识别、多轮对话、知识库自动检索能力可降低企业人工客服成本60%以上。公司服务标准为工作日9:00-18:00技术支持需求响应时效不超过4小时提供远程部署与现场培训服务。3. 代码fromlangchain.document_loadersimportTextLoaderfromlangchain.text_splitterimportRecursiveCharacterTextSplitterfromlangchain.embeddingsimportHuggingFaceEmbeddingsfromlangchain.vectorstoresimportChromafromlangchain.chainsimportRetrievalQAfromlangchain.llmsimportTongyi# 1. 加载你的文档loaderTextLoader(info.txt,encodingutf-8)docsloader.load()# 2. 切分成小块splitterRecursiveCharacterTextSplitter(chunk_size200,chunk_overlap0)splitssplitter.split_documents(docs)# 3. 向量化存入本地向量库embHuggingFaceEmbeddings(model_nameall-MiniLM-L6-v2)dbChroma.from_documents(splits,emb)retrieverdb.as_retriever()# 4. 接入大模型这里用通义千问填自己的API KeyllmTongyi(dashscope_api_key你的API_KEY,model_nameqwen-turbo)# 5. 组装RAG链ragRetrievalQA.from_chain_type(llmllm,chain_typestuff,retrieverretriever)# 6. 提问测试question公司的智能客服系统能带来什么效果print(rag.run(question))4. 运行结果模型会严格按你写的文档回答公司的智能客服系统具备意图识别、多轮对话、知识库自动检索能力可降低企业人工客服成本60%以上。四、RAG全链路文档切分→Embedding→向量库→检索→生成1. 文档切分切块解释把长篇大论拆成一小段一小段短文例子一本说明书、合同、笔记、PDF直接整篇太长没法用切成300-800字小片段目的片段短好查找信息集中不会杂乱小技巧切块留一点重叠内容防止关键句子被一刀切断丢信息2. Embedding 向量化解释Embedding 就是把文字、图片等东西转换成计算机能理解的数字向量一串数字。原理AI看不懂纯文字只能认数字意思越相近的文字数字密码越像举例“今天天气很好” 【1,3,5,7…】“今日天气不错” 【1.1,3.2,5.0,7.1…】两句数字几乎一致作用把所有文本块全部转成数字为快速搜索做准备3. 向量库存储解释专门放「文字片段对应数字密码」的专属仓库和普通数据库区别普通库搜关键词向量库搜语义相似度通俗理解把所有转好的数字密码整齐入库建好索引方便一秒查找新手首选轻量库Chroma、FAISS免安装、零配置4. 语义检索解释用户提问AI去仓库里找最匹配的资料用户输入问题把问题同样转成数字密码向量库对比所有库存数字捞出意思最接近的3-5段原文资料只拿有用素材过滤无关内容5. LLM生成回答解释拿着找到的真实资料让大模型整理成通顺答案固定指令约束只允许用检索到的资料回答不准自己瞎编知识流程用户问题找到的参考文档 → 丢给大模型 → 输出精准答案必备5个工具全免费文档读取读PDF/Word/TXT文本分割LangChain分割器一键切块嵌入模型Embedding本地免费BGE-M3不用付费接口向量库Chroma最简单一行代码启动大模型本地通义千问/DeepSeek离线可用实操最容易踩的坑切块太大回答杂乱无重点切块太小信息残缺答不全检索片段太多上下文过长模型混乱不加限制词模型脱离资料自由发挥瞎编不用本地Embedding依赖外网接口慢还花钱

空洞骑士模组管理器Scarab完整指南：从安装到精通的高效解决方案

空洞骑士模组管理器Scarab完整指南：从安装到精通的高效解决方案【免费下载链接】Scarab An installer for Hollow Knight mods written with Avalonia. 项目地址: https://gitcode.com/gh_mirrors/sc/Scarab 还在为空洞骑士模组安装的繁琐步骤而烦恼吗&…

2026/5/22 9:21:35 阅读更多

文泉驿微米黑：5MB超小体积解决企业级中文显示的技术革命

文泉驿微米黑：5MB超小体积解决企业级中文显示的技术革命【免费下载链接】fonts-wqy-microhei Debian package for WenQuanYi Micro Hei (mirror of https://anonscm.debian.org/git/pkg-fonts/fonts-wqy-microhei.git) 项目地址: https://gitcode.com/gh_mirrors…

2026/5/22 9:21:35 阅读更多

qmc-decoder终极指南：3分钟解锁QQ音乐加密文件，实现音频格式自由转换

qmc-decoder终极指南：3分钟解锁QQ音乐加密文件，实现音频格式自由转换【免费下载链接】qmc-decoder Fastest & best convert qmc 2 mp3 | flac tools 项目地址: https://gitcode.com/gh_mirrors/qm/qmc-decoder 你是否曾经在QQ音乐下载了心爱…

2026/5/22 9:20:17 阅读更多

艺术视频革命：artistic-videos项目全面解析与入门指南 [特殊字符]

艺术视频革命：artistic-videos项目全面解析与入门指南 🎨 【免费下载链接】artistic-videos Torch implementation for the paper "Artistic style transfer for videos" 项目地址: https://gitcode.com/gh_mirrors/ar/artistic-videos …

2026/5/22 10:07:06 阅读更多

UVa 262 Transferable Voting

题目分析本题模拟了一种特殊的选举计票系统——可转移投票（Transferable Voting\texttt{Transferable Voting}Transferable Voting）系统。在该系统中，选民需要对候选人进行排序投票，然后通过多轮计票和淘汰机制来确定最终的获胜者…

2026/5/22 10:07:06 阅读更多

10个remote-browser最佳实践：提升自动化脚本性能

10个remote-browser最佳实践：提升自动化脚本性能【免费下载链接】remote-browser A low-level browser automation framework built on top of the Web Extensions API standard. 项目地址: https://gitcode.com/gh_mirrors/re/remote-browser remote-brows…

2026/5/22 10:06:24 阅读更多

告别手动抢票烦恼：用Python自动化脚本3倍提升大麦网购票成功率

告别手动抢票烦恼：用Python自动化脚本3倍提升大麦网购票成功率【免费下载链接】Automatic_ticket_purchase 大麦网抢票脚本项目地址: https://gitcode.com/GitHub_Trending/au/Automatic_ticket_purchase 当周杰伦演唱会门票在3秒内售罄，当五月…

2026/5/22 10:05:19 阅读更多

网盘直链解析神器：八大平台免登录高速下载终极指南

网盘直链解析神器：八大平台免登录高速下载终极指南【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ，支持百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼云盘…

2026/5/22 10:05:19 阅读更多

如何通过3个核心机制彻底改变炉石佣兵战记的游戏体验？

如何通过3个核心机制彻底改变炉石佣兵战记的游戏体验？ 【免费下载链接】lushi_script This script is to save your time from Mercenaries mode of Hearthstone 项目地址: https://gitcode.com/gh_mirrors/lu/lushi_script 在《炉石传说》佣兵战记模式中&am…

2026/5/22 10:03:08 阅读更多

单日大涨4.52%！华泰柏瑞中韩半导体ETF（513310.SH）上演“高热度”行情，溢价率风险引关注

5月21日，华泰柏瑞中韩半导体ETF（513310.SH）延续强势表现，当日收盘价报5.625元，涨幅达4.52%，盘中交投异常活跃，换手率109.80%，量比为1.32，市场资金交易热情高涨。然而&…

2026/5/22 0:00:46 阅读更多

11. 架构：前端工程化与状态管理实战

写在前面：如果说后端 MVT 引擎是 GIS 系统的“心脏”，那么前端就是它的“大脑”和“面孔”。在现代 WebGIS 开发中，如何优雅地管理复杂的图层状态、如何处理海量瓦片的渲染逻辑，是决定项目成败的关键。今天，我们将深入 light-mvt-server 的前端核心，看看如何利用 Vite …

2026/5/22 0:01:27 阅读更多

淘金币自动化脚本终极指南：10分钟搞定淘宝日常任务，每天为你节省20分钟

淘金币自动化脚本终极指南：10分钟搞定淘宝日常任务，每天为你节省20分钟【免费下载链接】taojinbi 淘宝淘金币自动执行脚本，包含蚂蚁森林收取能量，芭芭农场全任务，解放你的双手项目地址: https://gitcode.com/gh_mi…

2026/5/22 0:02:07 阅读更多

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

站内源码及jar包下载一、项目概述文件下载中心一个基于 Java 内置 HTTP 服务器（com.sun.net.httpserver）构建的轻量级文件管理服务。它零第三方依赖，单 JAR 包即可运行，适合在内网环境或临时场景中快速搭建文件共享站点。你的团队需要临时共享一批日志文件或交付物，…

2026/5/21 8:30:37 阅读更多

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

加密位置: 逆向接口参数: 逆向接口: const g = globalThis; g.window = g; g.self = g; g.location = {<

2026/5/21 16:37:36 阅读更多

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南【免费下载链接】markor Text editor - Notes & ToDo (for Android) - Markdown, todo.txt, plaintext, math, .. 项目地址: https://gitcode.com/gh_mirrors/ma/markor 在移动设备上寻找一款…

2026/5/21 2:29:29 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…