04 RAG 检索增强

发布时间：2026/6/28 5:56:28

tags:/n - langchainrag检索增强向量检索面试aliases:/n - RAG检索增强生成04 RAG 检索增强一、RAG 介绍大模型的局限局限说明知识滞后训练数据有截止日期知识缺失不包含企业私有数据幻觉对不确定内容可能编造答案RAG 流程文档加载 → 切分 → 嵌入 → 向量存储 → 检索 → 生成RAG 核心组件组件作用示例DocumentLoader加载各种格式文档PDFLoader、DocxLoaderTextSplitter将文档切分为小块RecursiveCharacterTextSplitterEmbeddings文本转向量OpenAIEmbeddings、BGE-M3VectorStore存储和检索向量Milvus、ChromaRetriever相似度检索vector_store.as_retriever()二、文档加载文档加载演示运行方式python 04_文档加载.py fromlangchain_community.document_loadersimportPyPDFLoader,Docx2txtLoader# 加载 PDFloaderPyPDFLoader(document.pdf)docsloader.load()# 加载 DocxloaderDocx2txtLoader(document.docx)docsloader.load()fordocindocs:print(f内容:{doc.page_content[:100]}...)print(f元数据:{doc.metadata})三、文档切分文档切分演示运行方式python 04_文档切分.py fromlangchain.text_splitterimportRecursiveCharacterTextSplitter text_splitterRecursiveCharacterTextSplitter(chunk_size500,# 每块最大字符数chunk_overlap50,# 块间重叠字符数separators[\n\n,\n,。,, ],)chunkstext_splitter.split_documents(docs)print(f切分为{len(chunks)}个块)四、文档嵌入文档嵌入演示运行方式python 04_文档嵌入.py fromlangchain_openaiimportOpenAIEmbeddings embeddingsOpenAIEmbeddings(modeltext-embedding-3-small,base_urlhttps://dashscope.aliyuncs.com/compatible-mode/v1,api_keyos.getenv(DASHSCOPE_API_KEY),)# 单个文本嵌入vectorembeddings.embed_query(什么是LangChain)# 批量嵌入vectorsembeddings.embed_documents([LangChain是什么,RAG是什么])五、向量存储和检索Milvus LangChain Milvus 完整 RAG 流程运行方式python 04_RAG完整流程.py fromlangchain_openaiimportOpenAIEmbeddings,ChatOpenAIfromlangchain_milvusimportMilvusfromlangchain_core.promptsimportChatPromptTemplatefromlangchain_core.output_parsersimportStrOutputParserfromlangchain_core.runnablesimportRunnablePassthrough# 1. 初始化嵌入模型embeddingsOpenAIEmbeddings(modeltext-embedding-3-small,...)# 2. 初始化 Milvus 向量存储vector_storeMilvus(embedding_functionembeddings,connection_args{host:localhost,port:19530},collection_namelangchain_demo,)# 3. 添加文档fromlangchain_core.documentsimportDocument docs[Document(page_contentLangChain是大模型应用开发框架),Document(page_contentRAG是检索增强生成技术),Document(page_contentMilvus是开源向量数据库),]vector_store.add_documents(docs)# 4. 创建检索器retrievervector_store.as_retriever(search_kwargs{k:2})# 5. 构建 RAG ChainllmChatOpenAI(modelqwen-plus,...)promptChatPromptTemplate.from_template(根据以下参考资料回答问题\n\n{context}\n\n问题{question})defformat_docs(docs):return\n\n.join(doc.page_contentfordocindocs)rag_chain({context:retriever|format_docs,question:RunnablePassthrough()}|prompt|llm|StrOutputParser())# 6. 提问answerrag_chain.invoke(什么是LangChain)print(f答案:{answer})相关笔记[[01-LangChain概述]] · [[02-Model-IO与模型调用]] · [[03-提示词模板与Chains]] · [[05-Agents智能体]]

人工智能专业术语详解（Y）

在以字母Y开头的术语中，人工智能领域最耀眼的坐标当属 YOLO（You Only Look Once）——这一目标检测算法家族以其“只看一眼”的设计哲学，将实时性与精度的平衡推向了新高度。 YOLO不仅是一个算法名称，更代表了一种将目标…

2026/6/28 5:55:48 阅读更多

传统年轻人只爱潮牌，编程统计20到30岁新中式通勤服饰消费数据，验证国风成熟穿搭受众规模。

国风通勤服饰受众规模验证 — Python 数据分析方案一、实际应用场景描述行业背景（时尚产业与品牌创新课程延伸）在时尚产业研究与品牌企划中，长期存在一种经验性假设："20~30岁年轻人只爱潮牌，国风/新中式是中年人的…

2026/6/28 5:55:27 阅读更多

数据中心液冷行业的可靠伙伴：万斯得定制的流体检测设备

在数据中心液冷技术不断迭代的赛道上，万斯得始终以“以人为本，追求卓越”的企业宗旨为指引，将定制化的流体检测方案融入液冷行业的每一个环节。从在线检测设备流道清洗机的高效清洗，到实验室流体检测设备UQD快插性能试验机等各类流…

2026/6/28 5:55:27 阅读更多

如何突破华硕笔记本性能天花板？G-Helper开源控制引擎深度拆解

如何突破华硕笔记本性能天花板？G-Helper开源控制引擎深度拆解【免费下载链接】g-helper Lightweight Armoury Crate alternative for Asus laptops with nearly the same functionality. Works with ROG Zephyrus, Flow, TUF, Strix, Scar, ProArt, Vivobook, Zenb…

2026/6/28 7:09:17 阅读更多

终极AI篮球分析系统：5步快速掌握专业投篮检测与姿态分析技巧

终极AI篮球分析系统：5步快速掌握专业投篮检测与姿态分析技巧【免费下载链接】AI-basketball-analysis :basketball::robot::basketball: AI web app and API to analyze basketball shots and shooting pose. 项目地址: https://gitcode.com/gh_mirrors/ai/AI-ba…

2026/6/28 7:08:57 阅读更多

AI篮球分析系统实战：基于计算机视觉的投篮动作智能评估解决方案

AI篮球分析系统实战：基于计算机视觉的投篮动作智能评估解决方案【免费下载链接】AI-basketball-analysis :basketball::robot::basketball: AI web app and API to analyze basketball shots and shooting pose. 项目地址: https://gitcode.com/gh_mirrors/ai/AI…

2026/6/28 7:08:57 阅读更多

一体成型电感广东优选公司

随着消费电子、工业控制、储能、汽车电子等领域的快速发展，一体成型电感的性能、交付、成本要求持续提升。广东作为国内电子信息产业核心集群地，汇聚了大量优质电感生产商。我们从产品覆盖度、性能指标、替代能力、服务效率、性价比5个核心维度&#xff…

2026/6/28 7:07:56 阅读更多

信创版Java医院影像管理系统PACS （springboot+vue）

医院影像管理系统，覆盖从患者登记、影像采集、诊断报告到胶片打印的全流程。系统支持放射（CT/MR/DR）、超声（US）、病理（PATH）三大影像专科，工业级影像查看器，支持 DICOM 标…

2026/6/28 7:07:36 阅读更多

终极指南：5分钟在电脑上完美运行Switch游戏的Ryujinx模拟器

终极指南：5分钟在电脑上完美运行Switch游戏的Ryujinx模拟器【免费下载链接】Ryujinx 用 C# 编写的实验性 Nintendo Switch 模拟器项目地址: https://gitcode.com/GitHub_Trending/ry/Ryujinx 想在电脑上体验《塞尔达传说：王国之泪》的史诗冒险&…

2026/6/28 7:07:16 阅读更多

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

6个月前的2025年12月，Boris Cherny 公开宣布自己卸载了 IDE。一时间，Vibe Coding 成了全行业最热的话题。6个月后，当我们回过头来拉一份真实账本，发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/28 0:00:03 阅读更多

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

📫 个人主页：深夜coding算法 📣 专栏系列：2026年华为最新OD机试题库详解 🔥 一次订阅，永久解锁 | 持续更新100篇 | 6语言全覆盖文章目录❄️前言：☀️一：题目描述🌙 题目…

2026/6/28 1:01:08 阅读更多

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/6/28 1:02:09 阅读更多

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

2026/6/28 0:00:03 阅读更多

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/6/28 1:01:08 阅读更多

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/6/28 1:02:09 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/27 12:47:04 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/27 13:25:14 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/27 13:25:16 阅读更多

相关文章

人工智能专业术语详解（Y）

传统年轻人只爱潮牌，编程统计20到30岁新中式通勤服饰消费数据，验证国风成熟穿搭受众规模。

数据中心液冷行业的可靠伙伴：万斯得定制的流体检测设备

如何突破华硕笔记本性能天花板？G-Helper开源控制引擎深度拆解

终极AI篮球分析系统：5步快速掌握专业投篮检测与姿态分析技巧

AI篮球分析系统实战：基于计算机视觉的投篮动作智能评估解决方案

一体成型电感广东优选公司

信创版Java医院影像管理系统PACS （springboot+vue）

终极指南：5分钟在电脑上完美运行Switch游戏的Ryujinx模拟器

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因