RAG 知识库召回不准,我从切片、向量、重排这三处调了一遍(企业文档问答实录) 做企业文档问答的都知道模型本身不是瓶颈召回才是。我给公司一堆产品手册搭了个问答助手第一版答得稀烂——明明文档里写了的东西它说未找到相关内容。排查下来问题全在召回环节。记一下我调的三个地方。1. 切片粒度chunk第一版我图省事用了默认的大块切分一段几百字。结果一个 chunk 里塞了好几个主题向量化之后语义被稀释检索时匹配不上。改成按小节切、控制在两三百字、相邻块留点重叠之后召回立刻好转。经验宁可切细一点多召回几块也别切太粗。太粗是找不到太细顶多是多带点无关的后者好处理。2. 向量模型对不对路中文文档用了个偏英文的 embedding相似度算出来一团糟。换成对中文友好的向量模型后同义改写的问题也能命中了用户问咋退款文档写的是退货流程之前完全匹配不到。3. 加一层重排rerank向量召回粗筛出 Top10 之后再用一个重排模型按和问题的相关度重新排序取前 3 喂给大模型。这一步把召回到了但排在第 8 位、被截断扔掉的情况救回来不少。我是直接在讯飞星辰里搭的知识库切片参数、向量、重排它都能在界面里调省了我自己搭检索链路。缺点也有参数得自己一组组试没有银弹测评用例也得自己攒不然你不知道这次改到底是变好还是变差了。调召回这事没什么玄学就是切片→向量→重排一处处量化对比。我把我那套测试问题集和参数放评论区了。你们的知识库召回率现在大概多少