【专栏一：AI基础08】-【一张图讲清楚：RAG的原理（从“查资料”到“生成答案”全过程）】

发布时间：2026/6/19 12:57:32

文章目录一、一句话先讲清 RAG第一步先把公司的资料准备好第二步把每张“知识卡片”变成可搜索的形式第三步员工提问时系统先不急着回答而是先去“查”第四步不是把所有查到的内容都扔进去而是再筛一遍第五步把“问题查到的资料”一起交给大模型二、RAG 和普通搜索有什么区别思考RAG 本质上就是先查资料再回答。假设你在一家公司的内部办公系统里接入了一个 AI 助手。员工会直接问它问题比如“我们公司的年假有几天怎么申请”这时候AI 助手要怎么回答如果它只是一个普通大模型它可能会这样按自己训练时学到的一般常识回答猜一个“多数公司”的规则甚至编一个看起来很像真的答案但问题是每家公司制度都不一样真正准确的答案只在你们公司的制度文档里。这时候RAG 就派上用场了。一、一句话先讲清 RAG在这个案例里RAG 做的事情其实很简单员工提问 → 系统去知识库查制度文档 → 找到相关内容 → 把内容一起交给大模型 → 大模型基于资料回答也就是说AI 助手不再是“靠记忆回答”而是“查完资料再回答”。第一步先把公司的资料准备好在员工提问之前系统就已经在后台做准备了。比如公司有很多文档员工手册考勤制度年假制度报销流程加班规则这些文档本来只是 PDF、Word、网页之类的文件模型并不能直接高效地查。所以系统第一步要做的是把这些文档整理成“方便检索”的形式。具体怎么做比如《员工休假制度》这份文档有 20 页。系统不会整份整份去查而是会把它拆成很多小段。例如拆成第 1 段年假天数规则第 2 段试用期是否享受年假第 3 段请假申请流程第 4 段补休规则第 5 段法定假日说明你可以把它想象成本来是一整本手册现在被拆成很多“知识卡片”。这样做有个好处当用户问“年假有几天”时系统就不用把整本手册都塞给模型只需要找到最相关的那几张“知识卡片”就行。第二步把每张“知识卡片”变成可搜索的形式拆完之后还不够因为系统还得知道哪些内容和“年假有几天”这个问题最相关这里就要用到 RAG 里很核心的一步向量化Embedding这个词听起来有点吓人但在我们的案例里你可以这样理解系统会把每一段文字都变成一个“语义坐标”。比如“年假天数” 和 “休假几天” 在语义上很近“报销审批流程” 和 “年假申请” 就没那么近也就是说系统不只是看字面关键词而是在比较这段话的“意思”和用户问题的“意思”像不像。你可以把它想象成一个图书馆管理员不是只看标题而是大概知道每本书在讲什么。第三步员工提问时系统先不急着回答而是先去“查”现在真正的问题来了“我们公司的年假有几天怎么申请”普通大模型可能会立刻生成答案但 RAG 系统不会它会先做一件更稳妥的事先把用户的问题也做一次向量化然后去知识库里找最相关的内容。在这个案例里系统可能会从几百段公司制度里先筛出这些内容《员工休假制度》第 3 页正式员工每年享有 5 天年假《员工休假制度》第 4 页年假申请需在 OA 系统提交《员工手册》第 12 页年假需由直属主管审批你可以把这个过程想象成员工问了一个问题AI 助手没急着回答而是先冲进公司制度库里翻出最相关的三页资料摊在桌上。这就是 RAG 里面的“检索”。第四步不是把所有查到的内容都扔进去而是再筛一遍真实系统通常不会只查一次就结束。因为第一次检索到的内容里可能有些非常相关有些只是“沾边”。比如系统可能还顺手查到了调休制度病假制度节假日安排这些和“年假”有关但不是这次问题的重点。所以更高级一点的 RAG 系统会再做一步重新排序Rerank也就是再判断一次哪几段最值得给模型看哪几段可以先丢掉最后可能只保留最核心的 2~3 段内容。这一步你可以理解成图书馆管理员先抱来一摞书然后又快速翻了一遍只挑出最关键的几页给你。第五步把“问题查到的资料”一起交给大模型现在系统已经拿到了最相关的资料接下来不是直接把文档原文甩给用户而是把用户问题和检索出来的资料一起打包成一个新的提示词再交给大模型。在这个案例里模型真正收到的内容可能是这样的你是公司内部制度助手请严格根据以下资料回答问题。资料 1正式员工每年享有 5 天年假。资料 2年假申请需通过 OA 系统提交并由直属主管审批。用户问题我们公司的年假有几天怎么申请这时候大模型就不是在“猜”而是在“看着资料回答”。所以它最后生成的回答就会变成我们公司的正式员工每年享有5天年假。申请时需要通过 OA 系统提交并由直属主管审批。这和普通大模型最大的区别就在这里普通大模型靠记忆、靠概率生成RAG 系统靠检索到的资料增强回答这时候你就能真正理解 RAG 了我们把整个案例再压缩一遍——用户视角——员工问“我们公司的年假有几天怎么申请”系统内部发生的事去公司知识库里找相关制度找到“年假天数”和“申请流程”两段内容把这两段内容和用户问题一起交给大模型大模型基于资料生成答案最终结果AI 助手不再瞎猜而是“有依据地回答”。为什么 RAG 很重要因为现实中很多问题答案并不在模型参数里而在外部资料里。比如公司内部制度客服知识库最新产品文档法律法规更新医疗指南学校通知项目 Wiki这些内容有几个特点经常更新属于私有知识不可能每次都重新训练大模型所以最现实的做法不是“把所有东西都塞进模型脑子里”而是让模型在回答前先去查资料。这就是 RAG 的价值。二、RAG 和普通搜索有什么区别有些人看到这里会问这不就是搜索吗不完全是。普通搜索通常只做到帮你找资料但 RAG 会继续往后走一步帮你找资料帮你读资料帮你整理成最终答案也就是说搜索负责“找到”RAG 负责“找到并回答”。在我们的案例里搜索返回《员工休假制度》第 3 页和第 4 页RAG直接告诉你“5天年假需要通过 OA 提交并由直属主管审批”RAG 也不是万能的讲到这里也要顺手提醒一句RAG 不是“查了资料就一定完美”。如果下面这些环节做不好回答质量依然会差文档切分不合理检索结果不准相关资料没被召回提示词构造不好上下文太长被截断所以你可以把 RAG 理解为一个“让模型更少胡说”的系统方法而不是百分之百准确的魔法。RAG 的本质不是让模型更聪明而是让模型回答前先查资料。思考如果 RAG 的效果不好到底是哪一环出了问题是文档切分不对、检索不准还是提示词没写好

Ubuntu20.04下Boost安装避坑指南：解决Python路径报错问题

Ubuntu 20.04下Boost安装避坑指南：解决Python路径报错问题在开发C项目时，Boost库几乎是不可或缺的基础设施。但当你满怀期待地在Ubuntu 20.04上安装Boost时，却可能遭遇Python路径报错的当头一棒。这个问题尤其常见于Python 3.6及以上版本的环…

2026/6/19 21:01:53 阅读更多

Performance-Fish：彻底解决《环世界》后期卡顿的200+项优化技术深度解析

Performance-Fish：彻底解决《环世界》后期卡顿的200项优化技术深度解析【免费下载链接】Performance-Fish Performance Mod for RimWorld 项目地址: https://gitcode.com/gh_mirrors/pe/Performance-Fish Performance-Fish是《环世界》游戏中一个专注于性能…

2026/6/19 22:19:18 阅读更多

终极DenseNet社区贡献指南：如何快速参与CVPR最佳论文项目开发与改进

终极DenseNet社区贡献指南：如何快速参与CVPR最佳论文项目开发与改进【免费下载链接】DenseNet Densely Connected Convolutional Networks, In CVPR 2017 (Best Paper Award). 项目地址: https://gitcode.com/gh_mirrors/de/DenseNet DenseNet（D…

2026/6/17 10:03:20 阅读更多

Exo：如何用日常设备构建企业级AI集群的3大突破性方案

Exo：如何用日常设备构建企业级AI集群的3大突破性方案【免费下载链接】exo Run frontier AI locally. 项目地址: https://gitcode.com/GitHub_Trending/exo8/exo Exo是一个革命性的AI集群管理平台，它让企业能够利用现有的日常设备构建强大的分布式…

2026/6/20 1:35:18 阅读更多

传统门禁短板如何补齐？这款安卓终端给出技术答案

在物联网安防领域，门禁终端长期处于“功能机”时代——Linux系统、低算力、封闭生态、依赖有线网络。直到近几年，Android系统开始渗透门禁设备，才带来了交互和扩展性的质变。而中优云联ZU-YK800S的发布，则进一步将“Android门禁”…

2026/6/20 1:34:37 阅读更多

SQLi-Labs靶场从零搭建到通关全攻略（一）：环境搭建与基础四关

摘要：SQL注入是Web安全领域最经典、最常见的漏洞之一，而SQLi-Labs则是一个专为学习SQL注入而设计的开源靶场平台，共包含65个难度递增的关卡。本文作为系列攻略的第一篇，将从SQL注入的背景讲起，手把手带你完成SQLi-Labs…

2026/6/20 1:29:13 阅读更多

2026年成都GEO优化机构怎么选？从核心逻辑到机构测评全指南

AI搜索时代已经全面到来，超62%的用户在决策前会优先通过豆包、DeepSeek、通义千问等生成式AI工具获取信息，传统SEO已经无法满足企业“被信任、被选择”的获客需求，GEO（生成式引擎优化）作为全新的数字营销赛道&#xff…

2026/6/20 1:27:32 阅读更多

Python计算机毕设之基于 Django 的青岛滨海学院馆藏县志运维管理系统设计面向院校馆藏的县志捐赠借阅数据管理系统(完整前后端代码+说明文档+LW，调试定制等）

博主介绍：✌️码农一枚 ，专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围：&am…

2026/6/20 1:26:51 阅读更多

图算法的节点合并机制与复杂度简化模型的技术6

引言研究背景与意义：图算法在社交网络、生物信息学等领域的应用需求节点合并机制的定义：通过合并相似或冗余节点简化图结构复杂度简化模型的目标：降低计算成本，提升算法效率节点合并机制的核心方法基于相似度的合并定义节点相似度…

2026/6/20 1:25:51 阅读更多

MCU系统集成模块(SIM)详解：复位、中断与低功耗管理实战

1. 系统集成模块(SIM)在MCU中的核心角色在嵌入式开发领域，尤其是面对工业控制、汽车电子这类对可靠性要求极高的场景，我们常常把目光聚焦在CPU性能、外设功能或者通信协议栈上。然而，一个真正稳定、可靠的系统，其基石往往是一个默…

2026/6/20 0:00:26 阅读更多

MC68HC908RF2A定时器PWM生成原理与实战：无缓冲与缓冲模式详解

1. 项目概述与核心价值在嵌入式开发，尤其是电机驱动、LED调光、开关电源这些需要精确控制“能量”的领域，脉冲宽度调制（PWM）技术是工程师手中的一把瑞士军刀。它的本质很简单：用一个固定频率的方波，通过改变…

2026/6/20 0:02:08 阅读更多

在银河麒麟V10桌面(2205版本)上实战部署软RAID 1：从模块黑名单到自动挂载

1. 银河麒麟V10桌面系统与软RAID 1基础认知第一次在银河麒麟V10桌面上折腾软RAID 1时，我踩了不少坑。这个国产操作系统基于Linux内核，但2205版本对软RAID模块做了特殊处理，需要额外操作才能正常使用。软RAID 1其实就是磁盘镜像技术&#xff…

2026/6/20 0:02:08 阅读更多

音乐文件解锁实战指南：3个场景解决你的播放困境

音乐文件解锁实战指南：3个场景解决你的播放困境【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库： 1. https://github.com/unlock-music/unlock-music ；2. https://git.unlock-music.dev/um/web 项目地址: https://git…

2026/6/20 0:58:06 阅读更多

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

遥感卫星数据选型实战指南：从参数解析到场景化应用当面对GEE、PIE-Engine等云平台上数十种遥感数据源时，许多研究者常陷入选择困难——Landsat的历史连续性、Sentinel-2的红边波段优势、高分系列的亚米级分辨率各有千秋。本文将打破常规参数罗列式对比&a…

2026/6/20 0:58:07 阅读更多

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

1. 项目概述：MC68302 AutoBaud技术深度解析在嵌入式系统开发，尤其是那些需要与外部设备进行串口通信的场景里，最让人头疼的环节之一就是波特率匹配。想象一下，你设计了一个数据采集终端，需要连接来自不同厂家、不同年代…

2026/6/20 0:58:03 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/19 11:15:51 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/19 11:15:58 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/19 11:15:53 阅读更多

相关文章