1. 项目背景"我们的产品文档有 200 页,客服每天被重复问题问到崩溃。"产品总监在周会上拍着桌子说,“能不能让 AI 直接读我们的文档,用户问啥它答啥?”这不是科幻。这就是 RAG(Retrieval-Augmented Generation,检索增强生成)要做的事。但很多技术团队在落地 RAG 时,遇到了一系列让人抓狂的问题:PDF 里表格的数据提取出来全乱了、长文档切分不知道切多长合适、向量检索的结果和用户问题驴唇不对马嘴、换了 Embedding 模型后向量维度对不上导致数据库报错……这些问题的根源在于:RAG 不是简单的"上传文档→问问题→得答案",而是一个多阶段的流水线。Dify 把这个流水线封装成了可视化的操作:上传文件(支持 PDF/Word/Excel/Markdown/HTML/Notion 等 20+ 格式)→ 选择分段策略 → 选择 Embedding 模型 → 索引到向量数据库 → 配置检索模式 → 在 App 中使用。每一环都影响最终效果。本章将带你从文档上传到检索调优,完整走通 Dify 的 RAG 管线。你会理解为什么"好的分段"是 RAG 成功的一半,为什么"混合检索"比纯向量检索更靠谱,以及如何通过 Re-rank 来挽救低质量的检索结果。学完这一章,你就能自信地回答产品总监的那句话:“能,而且比你想的更好。”2. 项目设计小胖:(抱着一本打印出来的产品手册)“大师,我把这本 200 页的 PDF 上传到 Dify,建了个知识库,然后问了一句’产品保修期多久’,结果 AI 回复说’
第5章:知识库与 RAG 基础——文档问答从此不求人
发布时间:2026/6/26 9:45:43
1. 项目背景"我们的产品文档有 200 页,客服每天被重复问题问到崩溃。"产品总监在周会上拍着桌子说,“能不能让 AI 直接读我们的文档,用户问啥它答啥?”这不是科幻。这就是 RAG(Retrieval-Augmented Generation,检索增强生成)要做的事。但很多技术团队在落地 RAG 时,遇到了一系列让人抓狂的问题:PDF 里表格的数据提取出来全乱了、长文档切分不知道切多长合适、向量检索的结果和用户问题驴唇不对马嘴、换了 Embedding 模型后向量维度对不上导致数据库报错……这些问题的根源在于:RAG 不是简单的"上传文档→问问题→得答案",而是一个多阶段的流水线。Dify 把这个流水线封装成了可视化的操作:上传文件(支持 PDF/Word/Excel/Markdown/HTML/Notion 等 20+ 格式)→ 选择分段策略 → 选择 Embedding 模型 → 索引到向量数据库 → 配置检索模式 → 在 App 中使用。每一环都影响最终效果。本章将带你从文档上传到检索调优,完整走通 Dify 的 RAG 管线。你会理解为什么"好的分段"是 RAG 成功的一半,为什么"混合检索"比纯向量检索更靠谱,以及如何通过 Re-rank 来挽救低质量的检索结果。学完这一章,你就能自信地回答产品总监的那句话:“能,而且比你想的更好。”2. 项目设计小胖:(抱着一本打印出来的产品手册)“大师,我把这本 200 页的 PDF 上传到 Dify,建了个知识库,然后问了一句’产品保修期多久’,结果 AI 回复说’