本地 RAG 检索器：加载 FAISS 索引并实现语义搜索

发布时间：2026/6/16 12:30:12

【学习记录】本地 RAG 检索器加载 FAISS 索引并实现语义搜索在前一篇文章中我们构建了 PDF → 文本 → 向量 → FAISS 索引的完整流水线。本文展示如何使用该索引进行语义检索加载已保存的 FAISS 索引和 LlamaIndex 存储上下文创建一个不依赖 LLM 的检索器Retriever接受用户查询返回最相似的文本片段及其相关度分数。代码完全独立适合集成到问答系统或进一步分析检索结果。目录功能概述环境配置与依赖核心原理解析完整代码检索脚本执行方法运行效果示例注意事项总结一、功能概述本脚本实现了以下功能加载 Embedding 模型使用与构建索引时相同的 HuggingFace 中文嵌入模型BAAI/bge-small-zh-v1.5确保向量空间一致。读取 FAISS 索引从磁盘加载之前保存的 FAISS 索引文件vector_store.faiss。恢复 StorageContext利用 LlamaIndex 的持久化机制恢复文档存储docstore和索引结构。创建检索器基于索引构建一个检索器retriever支持top_k参数。交互式检索循环接受用户输入查询输出最相关的文本片段及其相关度分数L2 距离转换后的相似度。适用场景在 RAG 系统中可以先使用此脚本验证检索效果调试chunk_size、top_k等参数再接入 LLM 生成最终答案。二、环境配置与依赖Python 库依赖pipinstallllama-index-core llama-index-embeddings-huggingface llama-index-vector-stores-faiss faiss-cpu sentence-transformers库作用llama-index-coreLlamaIndex 核心提供索引加载、检索器等功能llama-index-embeddings-huggingfaceHuggingFace 嵌入模型适配器llama-index-vector-stores-faissFAISS 向量存储适配器faiss-cpuFAISS 库CPU 版本sentence-transformers嵌入模型依赖自动安装前置要求已经运行过上一篇文章中的构建脚本生成了./storage/faiss_index目录其中包含vector_store.faissFAISS 索引文件。docstore.json、index_store.json等 LlamaIndex 元数据文件。三、核心原理解析3.1 Embedding 模型一致性检索时使用的嵌入模型必须与构建索引时完全相同包括模型名称、维度。本脚本显式设置了相同的EMBED_MODEL和devicecpu保证查询向量与索引向量在同一空间。3.2 加载 FAISS 索引faiss_indexfaiss.read_index(faiss_path)faiss.read_index直接读取原生 FAISS 索引文件获得一个faiss.Index对象。通过faiss_index.ntotal可以查看索引中的向量总数。3.3 恢复 StorageContextvector_storeFaissVectorStore(faiss_indexfaiss_index)storage_contextStorageContext.from_defaults(persist_dirINDEX_DIR,vector_storevector_store)由于我们已经手动加载了 FAISS 索引需要将其包装成FaissVectorStore对象。StorageContext.from_defaults再从persist_dir中读取docstore.json和index_store.json恢复文档节点和索引结构。3.4 创建检索器retrieverindex.as_retriever(similarity_top_kTOP_K)检索器只执行相似度搜索不调用 LLM 生成答案。返回的每个节点带有score属性对于 L2 距离索引score是负的欧氏距离越接近 0 表示越相似实际使用中可转换为余弦相似度或直接使用。3.5 检索流程用户输入查询文本query。脚本调用Settings.embed_model.get_text_embedding(query)将查询转换为向量内部自动完成。FAISS 索引执行search操作返回top_k个最相似的向量索引及其距离。通过storage_context将索引映射回原始文本节点连同元数据一起返回。四、完整代码检索脚本创建文件search_index.py内容如下importosimportsysfromllama_index.coreimport(StorageContext,load_index_from_storage,Settings)fromllama_index.embeddings.huggingfaceimportHuggingFaceEmbeddingfromllama_index.vector_stores.faissimportFaissVectorStoreimportfaiss# # 配置与构建脚本保持一致# INDEX_DIR./storage/faiss_indexEMBED_MODELBAAI/bge-small-zh-v1.5TOP_K5# 检索 top-k 相似片段# # 初始化 Embedding 模型# print(加载 Embedding 模型...)Settings.embed_modelHuggingFaceEmbedding(model_nameEMBED_MODEL,devicecpu)# # 加载 FAISS 索引# faiss_pathos.path.join(INDEX_DIR,vector_store.faiss)ifnotos.path.exists(faiss_path):print(f错误索引文件不存在 -{faiss_path})sys.exit(1)print(读取 FAISS 索引...)faiss_indexfaiss.read_index(faiss_path)print(fFAISS 索引维度{faiss_index.d}, 向量数量{faiss_index.ntotal})vector_storeFaissVectorStore(faiss_indexfaiss_index)print(加载 StorageContext...)storage_contextStorageContext.from_defaults(persist_dirINDEX_DIR,vector_storevector_store)print(加载索引...)try:indexload_index_from_storage(storage_context)print(索引加载成功)exceptExceptionase:print(f索引加载失败{e})sys.exit(1)# 获取文档节点数量doc_countlen(index.docstore.docs)ifhasattr(index,docstore)else未知print(f索引中的文档节点数{doc_count})# # 创建检索器不包含 LLM 生成# retrieverindex.as_retriever(similarity_top_kTOP_K)# # 交互检索循环# print(\n*60)print(索引加载成功现在仅进行检索不调用 LLM。)print(输入 exit 或 quit 退出程序。)print(*60)whileTrue:queryinput(\n请输入检索查询).strip()ifquery.lower()in[exit,quit,q]:print(退出程序。)breakifnotquery:continueprint(\n检索中...)nodes_with_scoresretriever.retrieve(query)print(\n【检索到的文档片段】)ifnodes_with_scores:foridx,node_with_scoreinenumerate(nodes_with_scores,1):scorenode_with_score.scoreifhasattr(node_with_score,score)elseN/Anodenode_with_score.nodeprint(f\n片段{idx}(相关度:{score:.4f}))snippetnode.text[:800]...iflen(node.text)800elsenode.textprint(f文本:\n{snippet})ifnode.metadata:print(f元数据:{node.metadata})print(-*40)else:print(未检索到任何片段可能索引为空或查询无匹配。)print(\n*60)五、执行方法5.1 确保索引已存在首先运行上一篇文章中的构建脚本build_index.py生成./storage/faiss_index目录。5.2 运行检索脚本在终端中执行python search_index.py5.3 交互示例加载 Embedding 模型... 读取 FAISS 索引... FAISS 索引维度512, 向量数量126 加载 StorageContext... 加载索引... 索引加载成功索引中的文档节点数126 索引加载成功现在仅进行检索不调用 LLM。输入 exit 或 quit 退出程序。请输入检索查询医疗器械分类规则检索中... 【检索到的文档片段】片段 1 (相关度: 0.8234) 文本: 医疗器械按照风险程度分为三类第一类是风险较低第二类是中度风险第三类是较高风险... 元数据: {source: YY/T0664-2020} ---------------------------------------- 片段 2 (相关度: 0.7651) ...六、运行效果示例假设索引中包含某医疗器械标准文档的内容查询“分类规则”会返回相关段落及其相关度分数。score对于 L2 距离索引实际是负的欧氏距离越大表示越相似。用户可以根据分数阈值过滤低相关片段。七、注意事项问题说明解决方案模型不一致检索时使用的嵌入模型与构建时不同会导致向量空间不匹配检索结果完全错误。确保EMBED_MODEL与构建脚本完全一致。索引路径错误脚本中INDEX_DIR必须指向正确的目录。使用绝对路径或确认相对路径正确。内存不足加载大型 FAISS 索引可能占用大量内存。使用faiss的read_index时可设置mmap模式但 LlamaIndex 适配器可能需要全量加载。分数解释score不是标准的余弦相似度而是 FAISS 返回的距离转换值。可忽略具体数值仅用于排序。无检索结果可能查询与文档内容完全不相关或索引中文本过少。尝试更换查询词或增加chunk_size重新构建索引。八、总结本文提供了一个即用型语义检索脚本实现了✅ 加载 FAISS 索引和 LlamaIndex 存储。✅ 创建不依赖 LLM 的检索器。✅ 交互式查询展示相似文本片段及相关度分数。✅ 可直接集成到 RAG 系统的检索环节或用于调试分块策略。通过这个脚本你可以验证索引质量检查检索结果是否符合预期。调整TOP_K和CHUNK_SIZE参数观察召回效果变化。将检索到的节点传递给 LLM构建完整的问答系统。下一步可以结合上一篇文章的构建脚本形成一套完整的本地 RAG 知识库预处理与检索工具链。

5步终极指南：用OpenCore Legacy Patcher让老款Mac焕发新生

5步终极指南：用OpenCore Legacy Patcher让老款Mac焕发新生【免费下载链接】OpenCore-Legacy-Patcher Experience macOS just like before 项目地址: https://gitcode.com/GitHub_Trending/op/OpenCore-Legacy-Patcher 你是否还在为苹果官方不再支持的老款Ma…

2026/6/16 12:30:12 阅读更多

LeagueAkari英雄联盟助手：终极免费工具让你的游戏体验全面升级

LeagueAkari英雄联盟助手：终极免费工具让你的游戏体验全面升级【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power 🚀. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit 还在为繁琐的英雄联…

2026/6/16 12:29:52 阅读更多

5分钟打造你的专属Mac微信：WeChatExtension-ForMac全面美化指南

5分钟打造你的专属Mac微信：WeChatExtension-ForMac全面美化指南【免费下载链接】WeChatExtension-ForMac A plugin for Mac WeChat 项目地址: https://gitcode.com/gh_mirrors/we/WeChatExtension-ForMac 厌倦了千篇一律的Mac微信默认界面？想要让…

2026/6/16 12:29:11 阅读更多

7个步骤快速掌握PX4无人机飞控：从零开始到首次飞行实战指南

7个步骤快速掌握PX4无人机飞控：从零开始到首次飞行实战指南【免费下载链接】PX4-Autopilot PX4 Autopilot Software 项目地址: https://gitcode.com/gh_mirrors/px/PX4-Autopilot PX4无人机飞控系统是全球领先的开源自驾仪软件，支持多旋翼、固定…

2026/6/16 14:04:03 阅读更多

头部AI论文工具星级排名（2026 实测推荐）

基于功能全面性、学术适配性、用户反馈质量及操作便捷性，以下是当前主流AI论文写作工具的实测排名，按综合使用价值从高到低依次列出，并附上各工具的核心亮点与适用人群。🏆 第一梯队：全流程学术解决方案（★…

2026/6/16 14:04:03 阅读更多

暗黑破坏神2存档编辑器终极指南：免费开源工具快速定制游戏体验

暗黑破坏神2存档编辑器终极指南：免费开源工具快速定制游戏体验【免费下载链接】d2s-editor 项目地址: https://gitcode.com/gh_mirrors/d2/d2s-editor 你是否想过完全掌控暗黑破坏神2的游戏进度？d2s-editor是一款功能强大的开源存档编辑器&…

2026/6/16 14:03:01 阅读更多

Sniffles深度解析：长读长测序中基因组结构变异的精准检测原理与实战

1. 项目概述：从“sniffles”到基因组结构变异检测的利器如果你在生物信息学领域，特别是基因组测序数据分析的圈子里待过一阵子，大概率听说过“sniffles”这个名字。乍一看，它可能让人联想到感冒时的“抽鼻子”，但在生物…

2026/6/16 14:01:58 阅读更多

5分钟掌握PyPDF：Python PDF处理终极实战指南

5分钟掌握PyPDF：Python PDF处理终极实战指南【免费下载链接】pypdf A pure-python PDF library capable of splitting, merging, cropping, and transforming the pages of PDF files 项目地址: https://gitcode.com/GitHub_Trending/py/pypdf 还在为PDF文档…

2026/6/16 14:01:17 阅读更多

HsMod插件完整指南：55项功能助你畅玩炉石传说

HsMod插件完整指南：55项功能助你畅玩炉石传说【免费下载链接】HsMod Hearthstone Modification Based on BepInEx 项目地址: https://gitcode.com/GitHub_Trending/hs/HsMod HsMod是一款基于BepInEx框架开发的炉石传说多功能增强插件，为玩家提供…

2026/6/16 14:00:16 阅读更多

《LangChain 系列》Human-in-the-loop：什么时候必须让人工介入？

前面几章我们已经把 Agent、Tool、LangGraph 都讲完了。现在要补上最关键的一环：人工介入。没有 HITL 的 Agent，很像没有刹车的自动驾驶。它能跑，也可能跑得很快，但真正上线会让人害怕。企业里最危险的不是模型回答错一句话&a…

2026/6/16 0:01:15 阅读更多

3步彻底移除Windows Defender：终极Windows Defender Remover使用指南

3步彻底移除Windows Defender：终极Windows Defender Remover使用指南【免费下载链接】windows-defender-remover A tool which is uses to remove Windows Defender in Windows 8.x, Windows 10 (every version) and Windows 11. 项目地址: https://gitcode.com/…

2026/6/16 0:01:15 阅读更多

永春堂商业模式积分系统介绍：从理念到实践的转变

永春堂商业模式系统小程序开发方案：合规化健康零售服务平台技术实现指南本方案依托永春堂品牌大健康产品（如营养补充剂、草本洗护、五谷杂粮等普通食品/日化品类） 找演示：看专栏⬆️ 一、系统定位：去层级化、重产品…

2026/6/16 0:02:16 阅读更多

音乐文件解锁实战指南：3个场景解决你的播放困境

音乐文件解锁实战指南：3个场景解决你的播放困境【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库： 1. https://github.com/unlock-music/unlock-music ；2. https://git.unlock-music.dev/um/web 项目地址: https://git…

2026/6/16 0:26:20 阅读更多

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

遥感卫星数据选型实战指南：从参数解析到场景化应用当面对GEE、PIE-Engine等云平台上数十种遥感数据源时，许多研究者常陷入选择困难——Landsat的历史连续性、Sentinel-2的红边波段优势、高分系列的亚米级分辨率各有千秋。本文将打破常规参数罗列式对比&a…

2026/6/16 0:26:19 阅读更多

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

1. 项目概述：MC68302 AutoBaud技术深度解析在嵌入式系统开发，尤其是那些需要与外部设备进行串口通信的场景里，最让人头疼的环节之一就是波特率匹配。想象一下，你设计了一个数据采集终端，需要连接来自不同厂家、不同年代…

2026/6/16 0:26:18 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/16 10:45:34 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/16 10:18:11 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/16 10:18:16 阅读更多

相关文章