RAG 上下文组装:检索结果不是直接塞给大模型 现在这些 chunk 终于被筛出来了是不是直接拼进 Prompt扔给 LLM 就完事了很多 RAG 系统最后就是这么写的context \n\n.join([chunk.text for chunk in top_k]) answer llm(prompt context question)能跑甚至 demo 看起来还挺像那么回事。但到了真实业务里这一步经常翻车。因为检索结果不是上下文它只是上下文的原材料。RAG 的最后一公里不是“把材料塞进去”而是“把材料组织成 LLM 能读懂、能引用、能判断轻重的证据包”。一个典型 bad case假设用户问“跨境订单退款一般多久到账”Rerank 及其后续的一系列处理后拿到了最终 Top-5chunk10.91退款申请通过后系统将在 3-5 个工作日内原路退回…chunk20.88跨境订单因支付通道限制退款到账时间可能延长至 7-15 个工作日…chunk30.84用户可在订单详情页发起售后申请客服将在 24 小时内审核…chunk40.81特殊商品、虚拟商品、已拆封耗材不支持无理由退货…chunk50.79如退款超过预计时间可联系人工客服查询银行处理状态…看起来挺好相关内容都找到了。如果你直接按分数拼进去LLM 很可能回答退款申请通过后一般 3-5 个工作日到账如果超过预计时间可以联系客服。这答案不能说完全错但对用户这个问题来说就是错的。因为用户问的是“跨境订单”真正关键的是 chunk2 里的7-15 个工作日。为什么会错不是召回错了也不是 rerank 错了。chunk2 明明就在里面。问题出在上下文组装系统没有告诉 LLMchunk2 是“跨境订单”这个问题的主证据chunk1 只是普通订单的默认规则。chunk 不是证据证据也不是上下文这句话有点绕但很重要。chunk 是切出来的文本片段它可能缺标题、缺上下文、缺适用范围。单独看一句“3-5 个工作日到账”你不知道它说的是普通订单、跨境订单还是某个支付渠道。证据是能回答问题的信息单元。它不只包括正文还要包括标题、来源、章节路径、适用条件、时间版本有时候还要带上相邻段落。上下文是给 LLM 使用的证据包。它要有顺序、有边界、有来源、有轻重让模型知道哪些是主证据哪些是补充哪些只是背景。所以 RAG 最后一段不应该叫“拼接”更像是打包。你不是把一堆纸条扔到模型面前而是在帮它整理案卷主证据放前面补充材料放后面冲突点标出来来源编号贴清楚。第一步把 chunk 还原成可读证据很多 chunk 本身是残缺的。比如知识库原文是这样售后规则 / 退款到账时间 / 跨境订单由于跨境支付通道存在银行清算延迟退款审核通过后预计 7-15 个工作日到账。但切 chunk 的时候可能只留下了正文由于跨境支付通道存在银行清算延迟退款审核通过后预计 7-15 个工作日到账。对人来说还勉强能猜对 LLM 来说就少了几个关键线索这是售后规则、说的是退款到账时间、适用对象是跨境订单。所以组装上下文时第一件事是把结构信息补回来来源《售后规则》章节退款到账时间 / 跨境订单适用范围跨境订单正文由于跨境支付通道存在银行清算延迟退款审核通过后预计 7-15 个工作日到账。这一步很像第一篇讲过的父子索引检索可以用小 chunk回答最好给模型更完整的父级语境。但注意补上下文不是无限扩张。相邻 chunk 可以扩一两个父级标题可以带上更新时间可以带上。不要把整篇文档都塞进来那就又回到上一篇的超长上下文问题了。第二步按问题意图分组而不是散装排列真实问题往往不是只要一句话。比如“跨境订单退款多久到账”背后至少有三类信息主答案跨境订单退款 7-15 个工作日到账前置条件退款申请需要先通过审核异常处理超过预计时间可以联系客服查询银行状态如果你直接按 rerank 分数排列这三类信息会混在一起。LLM 要自己判断谁是主答案谁是补充说明谁是例外条件。它有时候能判断对有时候不行。尤其当普通规则分数更高、跨境规则分数略低时模型就容易把普通规则当成默认答案。更稳的做法是组装时先分组。直接答案组和问题实体、条件完全匹配的证据流程条件组审核、申请、前置条件异常补充组超时、失败、人工处理背景规则组普通订单、通用售后规则这样给到 LLM 的就不是一坨文本而是一个有层次的材料包。第三步顺序要服务答案不是服务分数Rerank 分数很重要但它不是最终上下文顺序的唯一标准。原因很简单分数代表相关性不代表表达顺序。一条“售后入口在哪里”的 chunk 可能分数很高因为它包含“退款申请”这些词但用户问的是多久到账它就不应该压过“7-15 个工作日”这个核心证据。我比较推荐的顺序是① 直接回答问题的主证据② 适用条件和例外规则③ 操作流程和补充解释④ 来源、时间、低优先级背景这和上一篇讲的 Lost in the Middle 也能接起来最关键的证据尽量放在开头必要时把第二关键证据放在结尾不要把核心答案埋在中间。简单说rerank 负责“谁有资格进来”上下文组装负责“进来之后坐哪儿”。第四步Token 预算要按价值分配很多系统做上下文截断时有个隐藏假设每个 chunk 同等重要。于是预算不够时就按长度或者分数机械截断。但在真实回答里不同信息的价值完全不一样直接答案必须保留限制条件尽量保留操作流程看问题需要背景介绍预算紧张时可以丢所以更合理的做法是按组分配预算。比如一个 3000 token 的上下文窗口可以大概这么切主证据1500 token限制和例外600 token流程补充500 token来源信息和引用编号200 token预留给问题和指令200 token这不是固定公式但思路很重要预算不是平均分是按答案价值分。第五步给每段材料贴上边界和来源上下文里最怕的事情是多段材料糊在一起。LLM 看到一长串文本不知道哪里是资料 1哪里是资料 2也不知道哪句话来自哪个文件。最后答案可能对但引用乱了或者引用对了解释混了。建议每段上下文都带一个稳定编号[资料1] 来源售后规则 退款到账时间 跨境订单 适用范围跨境订单 更新时间2026-04-12 内容由于跨境支付通道存在银行清算延迟退款审核通过后预计 7-15 个工作日到账。[资料2] 来源售后流程 退款申请 适用范围所有订单 内容用户提交退款申请后客服将在 24 小时内完成审核。这几个字段不只是给人看的也是在给 LLM 递信号编号方便引用和溯源来源方便判断可信度适用范围避免把普通规则套到特殊问题上更新时间遇到冲突时优先用新版本这一步会直接影响后面的引用、溯源和答案校验。一个推荐的组装流程把前面几篇串起来RAG 从 Rerank 后到送进 LLM比较稳的流程是这样① 强过滤低于阈值的候选先丢掉② 去重先净化候选池避免重复内容占预算③ 动态截断根据分数差距和 Token 预算决定保留多少④ 证据还原补标题、章节、相邻段落、父级语境⑤ 意图分组主答案、限制条件、流程、异常、背景分开⑥ 预算分配关键证据优先背景信息靠后⑦ 位置优化重要材料放头尾缓解 Lost in the Middle⑧ 编号封装带 source id、metadata再送进 Prompt这里最容易被忽略的是第 ④ 到第 ⑧。很多人以为 RAG 的难点在召回和排序到了 Top-K 就结束了。实则不然上下文组装也尤为重要。几个常见坑第一个坑只塞正文不塞标题。标题、章节路径、文档类型很多时候比正文还关键。正文里写“7-15 个工作日”标题里才写“跨境订单”。标题丢了适用范围就丢了。第二个坑相邻扩展太贪。看到一个命中 chunk就把前后各 5 段都带上。结果主证据没增强多少噪音先翻了几倍。相邻扩展要克制优先扩标题、定义、前置条件不要机械扩固定窗口。第三个坑metadata 越多越好。不是。作者、文件路径、抓取任务 ID、入库批次这些字段如果和回答无关就别塞。metadata 也吃 token而且会干扰模型。只带能影响回答的字段。第四个坑不标冲突。如果旧文档说 3-5 天新文档说 7-15 天别假装它们没冲突。要么按更新时间取最新要么在上下文里显式标出来让 Prompt 要求模型优先使用新版本。上下文组装的目标不是“信息最多”而是“让模型最不容易误解”。写在最后走到这里RAG 已经不再是“向量库 大模型”的简单组合了。检索负责把候选证据捞出来rerank 负责重新排序去重和截断负责控制质量与数量而上下文组装负责最后一件事把这些候选证据变成 LLM 能稳定使用的材料包。很多 RAG 答案看起来“差一点”不是因为模型不够强也不是因为知识库没内容而是因为证据进入模型时太散、太乱、缺少边界。所以这一篇可以记住一句话检索只是拿到原料上下文组装才是决定 LLM 实际能吃到什么。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】