第37章:多租户与大规模知识库治理 版本:LlamaIndex 0.12.x定位:解决企业级平台的组织和隔离问题源码关联:llama_index.core.schema、llama_index.core.indices、llama_index.vector_stores.qdrant实战目标:设计一个支持 100 个租户、千万级 Node 的知识库治理方案,并实现核心数据模型1. 项目背景某互联网公司的知识库平台从最初服务单一研发部门,迅速扩展到全集团——10 个事业部、100+ 个团队、5000 个用户。当前的架构设计简单直接:所有人的文档混在一个 Qdrant collection 里,通过 metadata 中的tenant_id字段在检索时做过滤。团队最初觉得这个方案"合情合理"——一个 collection 就够了,为什么要多建?直到三个事故连续爆发,技术负责人被叫进 VP 办公室。事故一:索引重建引发全公司中断。市场部要更新 300 篇产品文档,技术团队执行了重建索引操作。因为所有租户共享一个 collection,重建过程锁住了整个向量库——客服部的 FAQ 问答暂停 40 分钟,期间 200 多个工单无法自动答复;销售团队正在给客户演示的产品问答功能也直接白屏。一个部门的正常运维操作,变成了一场全公司的 P0 事故。事故二:跨租户数据泄漏。某研发人员在知识库搜索"组织架构调整",意外看