RAG 不再是热词但你的搜索栏离不开它。不是它没用而是早期过度承诺和工程瑕疵让人失望。RAG 没有过时它只是从聚光灯下沉到基础设施。热度的冰与火RAG 从爆火到降温2023年Q4顶峰后2024年平缓下降。但RAG 并未消失只是进入理性期生产中频频翻车的原因集中在检索质量、延迟、维护成本。检索阿克琉斯之踵大多数 RAG 系统只用简单的向量相似度搜索忽略语义匹配和排序缺少Query Rewriting、混合检索、Reranker等环节效果打折扣。理想 RAG 检索准确现实却是检索到无关片段回答胡编。延迟成本工程代价每次推理增加200-500ms延迟维护知识库的持续清洗和向量重计算成本甚至超过模型推理。很多团队低估了这些资源消耗。新范式分流长上下文模型和 Agent 方案分流了 RAG 的热度。但RAG 在需要外部知识库低频更新的场景仍有优势不再是唯一选择。正确用法场景匹配RAG 最适合知识库频繁更新、需要精确引用、数据可分割的场景必须做检索质量工程。可复用实践python# 先用 BM25 粗排再向量精排from rank_bm25 import BM25Okapifrom sentence_transformers import SentenceTransformerbm25 BM25Okapi(tokenized_corpus)model SentenceTransformer(all-MiniLM-L6-v2)# 粗排 top 50bm25_scores bm25.get_scores(query_tokens)top_bm25 np.argsort(bm25_scores)[-50:]# 精排 top 3embeddings model.encode([corpus[i] for i in top_bm25])query_emb model.encode([query])scores util.cos_sim(query_emb, embeddings)[0]top_indices np.argsort(scores)[-3:]设置可信度阈值缓存高频查询可降低延迟。检索质量是 RAG 的阿克琉斯之踵。技术的关键不是追新而是匹配问题。RAG 没有过时它只是从聚光灯下沉到基础设施。别被热度左右回到业务场景做选择——慢慢来技术是一步一步走出来的。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
为什么现在 RAG 越来越少被提及?
发布时间:2026/7/2 2:06:33
RAG 不再是热词但你的搜索栏离不开它。不是它没用而是早期过度承诺和工程瑕疵让人失望。RAG 没有过时它只是从聚光灯下沉到基础设施。热度的冰与火RAG 从爆火到降温2023年Q4顶峰后2024年平缓下降。但RAG 并未消失只是进入理性期生产中频频翻车的原因集中在检索质量、延迟、维护成本。检索阿克琉斯之踵大多数 RAG 系统只用简单的向量相似度搜索忽略语义匹配和排序缺少Query Rewriting、混合检索、Reranker等环节效果打折扣。理想 RAG 检索准确现实却是检索到无关片段回答胡编。延迟成本工程代价每次推理增加200-500ms延迟维护知识库的持续清洗和向量重计算成本甚至超过模型推理。很多团队低估了这些资源消耗。新范式分流长上下文模型和 Agent 方案分流了 RAG 的热度。但RAG 在需要外部知识库低频更新的场景仍有优势不再是唯一选择。正确用法场景匹配RAG 最适合知识库频繁更新、需要精确引用、数据可分割的场景必须做检索质量工程。可复用实践python# 先用 BM25 粗排再向量精排from rank_bm25 import BM25Okapifrom sentence_transformers import SentenceTransformerbm25 BM25Okapi(tokenized_corpus)model SentenceTransformer(all-MiniLM-L6-v2)# 粗排 top 50bm25_scores bm25.get_scores(query_tokens)top_bm25 np.argsort(bm25_scores)[-50:]# 精排 top 3embeddings model.encode([corpus[i] for i in top_bm25])query_emb model.encode([query])scores util.cos_sim(query_emb, embeddings)[0]top_indices np.argsort(scores)[-3:]设置可信度阈值缓存高频查询可降低延迟。检索质量是 RAG 的阿克琉斯之踵。技术的关键不是追新而是匹配问题。RAG 没有过时它只是从聚光灯下沉到基础设施。别被热度左右回到业务场景做选择——慢慢来技术是一步一步走出来的。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】