Vector Store：FAISS、Chroma、Milvus、Qdrant、ES 怎么选？

发布时间：2026/6/14 19:24:30

1、Vector Store 不是普通数据库普通数据库更擅长精确匹配。你查订单号它能准。你查用户 ID它也能准。但 RAG 场景不是这么问的。用户不会说“我要第 32 页第 5 段”。用户只会问“合同里违约责任怎么写”、“三安光电这份公告到底利好还是利空”、“提前还款怎么操作”这时候系统要做的不是关键词匹配而是语义匹配。意思相近就应该能找回来。Vector Store 就是为这件事服务的。把它想成一个仓库仓库里放的不是原文而是原文的“语义坐标”。用户问题进来也先变成坐标再去找最近的资料。2、LangChain 对 Vector Store 做了什么封装LangChain 的价值不是自己重新造一个向量数据库。它的价值是提供一套统一接口。今天你用 FAISS明天换 Milvus后天接 Elasticsearch业务链路不用整体推倒重写。官方文档里Vector Store 的统一接口主要围绕三件事add_documents 添加文档delete 删除文档similarity_search 做语义相似检索。初始化时通常要传入 Embedding 模型因为入库和查询都离不开向量化。所以它的抽象非常清楚文档进来变成向量写入仓库问题进来变成向量检索文档。源码层面核心类是 VectorStore。它是一个抽象基类。基类负责定义标准动作真正的存储和搜索由不同子类实现。FAISS 有自己的实现Chroma 有自己的实现Milvus、Qdrant、Elasticsearch 也都有自己的实现。3、add_documents() 到底做了什么先看入库。很多人以为 add_documents() 就是把 Document 原封不动塞进数据库。不是。源码逻辑更像这样先拿到 Document再拆出 page_content、metadata、id。如果子类实现了 add_texts()基类就会把文本和元数据转交给 add_texts()。具体怎么写入索引由子类决定。源码压缩成伪代码VectorStore.add_documents(documents)- texts [doc.page_content]- metadatas [doc.metadata]- ids [doc.id]- self.add_texts(texts, metadatas, ids)子类 add_texts / add_documents- embedding.embed_documents(texts)- 写入 vector text metadata id- 返回 ids这条链路非常关键。因为所有向量库的差异最后都落在“子类怎么写入”和“子类怎么搜索”。LangChain 只负责统一门面。用 InMemoryVectorStore 看得最清楚它内部用一个字典保存数据。每条记录里有 id、vector、text、metadata。入库时先调用 embedding.embed_documents()再把向量和原文一起保存。4、similarity_search() 到底怎么搜查询时也不是直接拿字符串去搜。第一步仍然是向量化。用户问题先被 embed_query() 转成查询向量。然后向量库拿这个查询向量去索引里找最近的文档。在 InMemoryVectorStore 的实现里思路很直接把所有文档向量取出来计算查询向量和文档向量的余弦相似度然后按分数排序取 TopK。生产级向量库会用更高效的索引结构但抽象思想一样。查询链路query - embed_query - vector search - TopK documents - List[Document]。5、as_retriever()为什么要把 Vector Store 变成 Retriever这是很多人容易混淆的一点。Vector Store 本身不一定是 Runnable。Retriever 才是 LangChain 链路里更标准的“可调用检索组件”。官方语义搜索教程也强调VectorStore 对象不继承 RunnableRetriever 是 Runnable所以有 invoke、batch 等标准方法。也就是说在 RAG 链里常见写法是先 vectorstore.as_retriever()再 retriever.invoke(query)。源码层面as_retriever() 做的事情很直接用当前 vectorstore 创建一个 VectorStoreRetriever并把 search_type、search_kwargs 等参数带进去。6、三种 search_type别乱用VectorStoreRetriever 默认支持三类搜索。它们不是装饰参数而是三种不同的检索策略。第一种是 similarity。最朴素直接找最相似的 TopK。适合大部分基础 RAG。第二种是 similarity_score_threshold。先算相关度再按分数阈值过滤。适合不想硬凑答案的场景。没有足够相关资料就应该少答或者不答。第三种是 mmr。它不只看相似度也看多样性。适合同质化文档很多的知识库。比如同一份公告被多家媒体转载如果只用 similarity很容易召回一堆重复内容MMR 可以让结果更分散。similarity 追求相似threshold 追求可信MMR 追求不重复。7、FAISS、Chroma、Milvus、Qdrant、ES 怎么选向量库选型不要看谁名气大。要看四个问题数据多大、是否需要复杂过滤、团队会不会运维、是否需要关键词和向量混合检索。FAISS最快开始但不是完整数据库FAISS 更像一个高性能本地向量索引库。它适合实验、离线索引、小型服务。LangChain 的 FAISS 文档里也提供了保存、加载、合并索引以及 as_retriever 转成 Retriever 的用法。它的优点是轻。缺点也明显权限、多租户、服务化、分布式治理都不是它最擅长的部分。Chroma开发体验好适合快速迭代Chroma 适合快速做知识库。它可以本地跑也可以连接 server 或 cloud。LangChain 的 Chroma 文档里创建 vectorstore 后可以直接 add_documents、update_documents、delete再进行查询。如果你是做 Demo、个人知识库、中小型 RAGChroma 很顺手。大型生产系统要看团队对持久化、备份、权限和运维的要求。Milvus大规模生产优先考虑Milvus 是正经向量数据库。LangChain 的 Milvus 文档明确提到如果数据量很大例如超过百万向量更推荐部署性能更强的 Milvus Server并利用不同索引提升检索能力。它更适合企业级、百万级以上向量、需要 Docker/Kubernetes 部署和索引调优的场景。代价是运维复杂度更高。Qdrant过滤和工程体验都不错Qdrant 的特点是 payload / metadata 友好。LangChain 文档里提到 Qdrant 会把文本和 metadata 放在 payload 结构里也支持 named vectors 和 hybrid retrieval 模式。如果你的 RAG 经常要按租户、来源、时间、业务类型过滤Qdrant 是值得重点看的方案。Elasticsearch已有 ES 体系就别急着再上一套Elasticsearch 的优势不是“纯向量最强”而是搜索体系成熟。关键词、过滤、聚合、权限、日志、运维经验很多团队已经有现成基础。LangChain 的 Elasticsearch 文档里展示了向量相似搜索、metadata filter、score threshold retriever也说明 Elasticsearch 支持 cosine、euclidean、dot_product 等向量距离算法。已有 ES 团队优先考虑 ES 向量检索 BM25 混合召回。不要为了追新技术把系统复杂度拉爆。8、统一接口背后的差异在哪里LangChain 统一了接口但没有抹平底层能力差异。差异主要在四个地方第一如何建索引。第二如何过滤 metadata。第三如何更新和删除。第四如何扩展到大数据量和高并发。所以你看源码时不要只看 VectorStore 基类。基类只告诉你“应该有什么方法”。真正要看子类它怎么接客户端、怎么建 collection、怎么把 Document 转成底层 payload、怎么把查询结果还原成 Document。读源码顺序VectorStore 基类 - 目标向量库子类 - add_documents/add_texts - similarity_search - as_retriever。9、企业级落地Vector Store 只是其中一环很多 RAG 系统效果不好不是向量库选错了而是前后链路都没做好。切分太烂入库就是垃圾。metadata 不全过滤就做不起来。没有重排召回结果就容易混杂。没有评测效果好坏只能靠感觉。没有版本管理文档更新后新旧数据混在一起。生产环境要补上的能力• 文档 ID每个 Chunk 要有稳定 ID方便更新、删除、回滚。• 元数据source、tenant、page、section、time、permission 都要保留。• 批量入库Embedding 要做批处理、重试、限流和失败补偿。• 混合检索向量召回 BM25 关键词召回再做 RRF 融合。• 重排TopK 只是粗召回重要场景要加 Rerank。• 评测记录 query、召回文档、分数、最终答案、用户反馈。10、总结图 7本章总结Vector Store 不负责让模型变聪明。它负责把资料找准。找得准模型才有机会答得准。找不准后面的 Prompt 再漂亮模型也只能胡说。源码层面它就是一套统一抽象Document 入库Embedding 生成向量VectorStore 保存索引Retriever 调用检索最后返回 List[Document]。工程层面它是一套选型问题小数据用轻量方案快速迭代用 Chroma大规模生产看 Milvus/Qdrant已有 ES 体系就考虑 ES 混合检索。真正成熟的 RAG不是“上了向量库”。而是数据、索引、过滤、召回、重排、评测、监控全部闭环。内容来源Vector StoreFAISS、Chroma、Milvus、Qdrant、ES 怎么选功能变化与行业影响解析_热闻岛

LangChain 系列：从 0 搭一个企业知识库问答系统

这一章不再单讲一个组件，而是把前面所有 RAG 组件合起来：从文件上传，到向量入库，再到用户提问、检索证据、模型回答、日志追踪。 01 先搞清楚：企业知识库问答不是 Demo Demo 只要能回答。企业系统要能上传、能解析、…

2026/6/14 19:24:09 阅读更多

AI Agent Runtime 正在归零：从操作系统时刻看基础设施分层

1. 这不是新赛道，而是 runtime 层的“操作系统时刻”正在重演你打开手机看到新闻标题《Anthropic Just Shipped the Layer That’s Already Going to Zero》，第一反应可能是：又一个大模型公司搞出了什么黑科技？但如果你真花十分钟…

2026/6/14 19:23:48 阅读更多

开源阅读鸿蒙版实战手册：构建你的专属跨设备数字阅读生态

开源阅读鸿蒙版实战手册：构建你的专属跨设备数字阅读生态【免费下载链接】legado-Harmony 开源阅读鸿蒙版仓库项目地址: https://gitcode.com/gh_mirrors/le/legado-Harmony 在信息爆炸的时代，如何高效管理个人阅读内容，实现跨设备无…

2026/6/14 19:23:07 阅读更多

UniversalUnityDemosaics：Unity游戏视觉还原的终极方案

UniversalUnityDemosaics：Unity游戏视觉还原的终极方案【免费下载链接】UniversalUnityDemosaics A collection of universal demosaic BepInEx plugins for games made in Unity3D engine 项目地址: https://gitcode.com/gh_mirrors/un/UniversalUnityDemosaics…

2026/6/14 21:09:03 阅读更多

ComfyUI IPAdapter终极指南：5分钟掌握AI图像风格迁移与人物控制

ComfyUI IPAdapter终极指南：5分钟掌握AI图像风格迁移与人物控制【免费下载链接】ComfyUI_IPAdapter_plus 项目地址: https://gitcode.com/gh_mirrors/co/ComfyUI_IPAdapter_plus ComfyUI IPAdapter是AI图像生成领域最强大的图像条件控制插件之一&#xff0…

2026/6/14 21:07:21 阅读更多

Path of Building PoE2：3步掌握流放之路2角色构建终极指南

Path of Building PoE2：3步掌握流放之路2角色构建终极指南【免费下载链接】PathOfBuilding-PoE2 项目地址: https://gitcode.com/GitHub_Trending/pa/PathOfBuilding-PoE2 还在为《流放之路2》复杂的天赋树和装备搭配而头疼？Path of Building P…

2026/6/14 21:07:21 阅读更多

2026职场新人学数据分析的价值与路径

一、数据分析在2026职场的核心价值行业需求增长：全球数据量持续爆发，企业数字化进程加速，数据分析技能成为基础能力岗位适配性：运营、市场、产品等非技术岗均需数据驱动决策，技术岗（如开发）需数…

2026/6/14 21:05:18 阅读更多

戴森球计划8000+工厂蓝图：如何构建模块化星际生产系统

戴森球计划8000工厂蓝图：如何构建模块化星际生产系统【免费下载链接】FactoryBluePrints 游戏戴森球计划的**工厂**蓝图仓库项目地址: https://gitcode.com/GitHub_Trending/fa/FactoryBluePrints FactoryBluePrints是戴森球计划游戏中最全面的工厂蓝图仓库…

2026/6/14 21:05:18 阅读更多

终极HTML5视频播放速率控制技术：Video Speed Controller深度解析

终极HTML5视频播放速率控制技术：Video Speed Controller深度解析【免费下载链接】videospeed HTML5 video speed controller (for Google Chrome) 项目地址: https://gitcode.com/gh_mirrors/vi/videospeed 在当今多媒体内容爆炸的时代，HTML5视频…

2026/6/14 21:04:37 阅读更多

音乐文件解锁实战指南：3个场景解决你的播放困境

音乐文件解锁实战指南：3个场景解决你的播放困境【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库： 1. https://github.com/unlock-music/unlock-music ；2. https://git.unlock-music.dev/um/web 项目地址: https://git…

2026/6/14 0:00:09 阅读更多

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

遥感卫星数据选型实战指南：从参数解析到场景化应用当面对GEE、PIE-Engine等云平台上数十种遥感数据源时，许多研究者常陷入选择困难——Landsat的历史连续性、Sentinel-2的红边波段优势、高分系列的亚米级分辨率各有千秋。本文将打破常规参数罗列式对比&a…

2026/6/14 0:00:30 阅读更多

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

1. 项目概述：MC68302 AutoBaud技术深度解析在嵌入式系统开发，尤其是那些需要与外部设备进行串口通信的场景里，最让人头疼的环节之一就是波特率匹配。想象一下，你设计了一个数据采集终端，需要连接来自不同厂家、不同年代…

2026/6/14 0:01:11 阅读更多

音乐文件解锁实战指南：3个场景解决你的播放困境

2026/6/14 0:00:09 阅读更多

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

2026/6/14 0:00:30 阅读更多

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

2026/6/14 0:01:11 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/14 10:35:25 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/14 10:02:42 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/14 10:02:42 阅读更多

相关文章

LangChain 系列：从 0 搭一个企业知识库问答系统

AI Agent Runtime 正在归零：从操作系统时刻看基础设施分层

开源阅读鸿蒙版实战手册：构建你的专属跨设备数字阅读生态

UniversalUnityDemosaics：Unity游戏视觉还原的终极方案

ComfyUI IPAdapter终极指南：5分钟掌握AI图像风格迁移与人物控制

Path of Building PoE2：3步掌握流放之路2角色构建终极指南

2026职场新人学数据分析的价值与路径

戴森球计划8000+工厂蓝图：如何构建模块化星际生产系统

终极HTML5视频播放速率控制技术：Video Speed Controller深度解析

音乐文件解锁实战指南：3个场景解决你的播放困境

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

音乐文件解锁实战指南：3个场景解决你的播放困境

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因