先搞懂基础我们把文字转成数字向量存入向量库用户提问也转成向量检索器就是在库里找语义最像的内容下面用大白话讲清所有常用策略。一、先明白两个基础概念相似度可以理解成 “两个人像不像”。向量数值在向量空间越接近代表两段文字意思越相近检索就靠这个判断。Top-KK 是数字比如 K4就是最终返回最相关的前 4 条内容。二、四大基础检索策略日常最常用1. 基础相似度检索Similarity用法只按语义相似度从高到低排序直接取出前 K 条。举例搜 “怎么做番茄炒蛋”库里所有菜谱按相关度排队挑最匹配的 4 条。优点简单、速度快、匹配精准绝大多数通用场景首选。缺点返回内容容易高度重复比如连续好几条都是番茄炒蛋步骤缺少不同角度的内容。2. 最大边际相关检索MMR核心逻辑既要内容相关又要内容不重复。 先选出一批高相关内容再从中筛选踢掉和已选内容高度雷同的条目。举例同样搜番茄炒蛋返回的内容会兼顾做法、小贴士、家常版本、饭店版本丰富不重复。适用场景需要多角度回答、怕内容同质化的对话、文案生成。3. 相似度阈值过滤Similarity Score Threshold核心逻辑设一条 “及格线”只留下达标内容。 比如设定分数线 0.5相似度低于 0.5 的内容直接丢掉哪怕凑不够 K 条也不要。举例搜 “手机推荐”库里夹杂大量电脑、耳机内容这条策略会自动筛掉无关内容杜绝答非所问。适用场景数据杂乱、噪声多对回答准确度要求极高的场景。4. 元数据过滤检索Metadata Filter核心逻辑先按标签筛选范围再做语义匹配。 存入向量库时会给文档打标签时间、分类、作者、来源、语种等。检索时先锁定标签范围再找相似内容。举例只查「2026 年」「技术类」的文档自动跳过历史、娱乐内容。适用场景企业知识库、分栏目文档、有严格分类要求的系统。三、四种进阶组合策略解决复杂问题1. 混合检索向量 关键词纯向量擅长理解语义比如 “智能手机” 和 “手机” 能识别为一个意思但对专有名词、数字、代码不敏感。 于是两者搭配向量负责语义关键词检索BM25负责精准抓名词、编号结果合并排序。适用技术文档、合同、代码库、带编号 / 专业术语的资料。2. 多查询检索核心逻辑把用户一句话拆成好几个角度的问题一起搜。举例用户问 “夏天怎么养花”系统自动扩展出夏天养花注意事项、夏季浇水技巧、夏季花卉防晒多条问题分别检索再合并结果。作用补全用户模糊的提问搜到更多相关内容。3. 重排序Re-Ranking两步走粗搜先从库里快速找出几十条疑似相关内容追求速度精排用更精准的模型重新打分、排序留下最优几条追求准确度。特点牺牲一点点速度大幅提升检索质量高端问答、知识库常用。4. 父子文档检索核心逻辑大块文章拆成小片段存储检索到片段后连带它所属的完整段落 / 原文一起返回。举例一本长篇教程拆成一句一段存库。检索命中其中一句话系统自动把这句话前后完整上下文都给出来。适用论文、书籍、长文档、需要完整上下文解读的场景。四、场景快速选型一看就会普通问答、简单知识库 → 用基础相似度检索想要答案丰富、不重复 → 用MMR文档杂乱、严防答非所问 → 加相似度阈值文档分分类、分时间、分部门 → 搭配元数据过滤技术文档、带术语 / 代码 → 用混合检索书籍、论文等长文本 → 用父子文档检索五、一句话总结检索器的本质就是先靠向量找语义相近的内容再用不同策略做筛选、去重、补全、精准优化。简单场景用基础策略复杂业务组合进阶策略最终平衡「速度、准确度、内容多样性」三大目标
[智能体-313]:向量数据库检索器(Retriever)检索策略通俗详解
发布时间:2026/6/7 16:59:13
先搞懂基础我们把文字转成数字向量存入向量库用户提问也转成向量检索器就是在库里找语义最像的内容下面用大白话讲清所有常用策略。一、先明白两个基础概念相似度可以理解成 “两个人像不像”。向量数值在向量空间越接近代表两段文字意思越相近检索就靠这个判断。Top-KK 是数字比如 K4就是最终返回最相关的前 4 条内容。二、四大基础检索策略日常最常用1. 基础相似度检索Similarity用法只按语义相似度从高到低排序直接取出前 K 条。举例搜 “怎么做番茄炒蛋”库里所有菜谱按相关度排队挑最匹配的 4 条。优点简单、速度快、匹配精准绝大多数通用场景首选。缺点返回内容容易高度重复比如连续好几条都是番茄炒蛋步骤缺少不同角度的内容。2. 最大边际相关检索MMR核心逻辑既要内容相关又要内容不重复。 先选出一批高相关内容再从中筛选踢掉和已选内容高度雷同的条目。举例同样搜番茄炒蛋返回的内容会兼顾做法、小贴士、家常版本、饭店版本丰富不重复。适用场景需要多角度回答、怕内容同质化的对话、文案生成。3. 相似度阈值过滤Similarity Score Threshold核心逻辑设一条 “及格线”只留下达标内容。 比如设定分数线 0.5相似度低于 0.5 的内容直接丢掉哪怕凑不够 K 条也不要。举例搜 “手机推荐”库里夹杂大量电脑、耳机内容这条策略会自动筛掉无关内容杜绝答非所问。适用场景数据杂乱、噪声多对回答准确度要求极高的场景。4. 元数据过滤检索Metadata Filter核心逻辑先按标签筛选范围再做语义匹配。 存入向量库时会给文档打标签时间、分类、作者、来源、语种等。检索时先锁定标签范围再找相似内容。举例只查「2026 年」「技术类」的文档自动跳过历史、娱乐内容。适用场景企业知识库、分栏目文档、有严格分类要求的系统。三、四种进阶组合策略解决复杂问题1. 混合检索向量 关键词纯向量擅长理解语义比如 “智能手机” 和 “手机” 能识别为一个意思但对专有名词、数字、代码不敏感。 于是两者搭配向量负责语义关键词检索BM25负责精准抓名词、编号结果合并排序。适用技术文档、合同、代码库、带编号 / 专业术语的资料。2. 多查询检索核心逻辑把用户一句话拆成好几个角度的问题一起搜。举例用户问 “夏天怎么养花”系统自动扩展出夏天养花注意事项、夏季浇水技巧、夏季花卉防晒多条问题分别检索再合并结果。作用补全用户模糊的提问搜到更多相关内容。3. 重排序Re-Ranking两步走粗搜先从库里快速找出几十条疑似相关内容追求速度精排用更精准的模型重新打分、排序留下最优几条追求准确度。特点牺牲一点点速度大幅提升检索质量高端问答、知识库常用。4. 父子文档检索核心逻辑大块文章拆成小片段存储检索到片段后连带它所属的完整段落 / 原文一起返回。举例一本长篇教程拆成一句一段存库。检索命中其中一句话系统自动把这句话前后完整上下文都给出来。适用论文、书籍、长文档、需要完整上下文解读的场景。四、场景快速选型一看就会普通问答、简单知识库 → 用基础相似度检索想要答案丰富、不重复 → 用MMR文档杂乱、严防答非所问 → 加相似度阈值文档分分类、分时间、分部门 → 搭配元数据过滤技术文档、带术语 / 代码 → 用混合检索书籍、论文等长文本 → 用父子文档检索五、一句话总结检索器的本质就是先靠向量找语义相近的内容再用不同策略做筛选、去重、补全、精准优化。简单场景用基础策略复杂业务组合进阶策略最终平衡「速度、准确度、内容多样性」三大目标