AI应用开发面试手册(精简版) AI应用开发面试手册精简版本手册覆盖RAG检索增强生成 Agent智能体开发两大核心方向全部来自生产落地高频面试题提炼为核心得分要点可直接背诵。面试时先答核心框架再根据追问补充细节。第一篇 RAG检索增强生成篇模块一 RAG核心原理与挑战核心题1RAG技术的核心挑战是什么对应有哪些落地方案背诵要点6大核心挑战文档解析难、分块切分难、召回准确率低、排序精度不足、拒答边界难控、权限隔离复杂对应解法解析按格式走专用解析器保留结构化元数据分块结构化切分重叠窗口父子分块召回关键词向量混合召回 查询改写排序Rerank重排 多路信号融合拒答置信度体系多维度打分判断权限入库打标 检索层强制过滤 生成前二次校验高频追问RAG和微调怎么选型各自适用场景RAG知识更新频繁、需要溯源、数据敏感、快速迭代成本低见效快微调固定领域风格/话术、能力对齐、大量高质量标注数据成本高周期长生产级方案RAG做知识底座 轻量微调做风格/格式对齐什么是Naive RAG进阶RAG架构有哪些Naive RAG切片→向量化→检索→生成基础流程效果上限低进阶高级RAG查询改写、重排、元数据过滤、模块化RAG、Agentic RAG、Graph RAG模块二 文档处理与分块核心题1文档分块有哪些最佳实践背诵要点不按固定字符数硬切优先按标题、段落、语义边界结构化切分相邻块设置10%-20%重叠避免上下文断裂保留标题、章节、页码等元数据每个块附带上下文信息复杂场景用父子分块子块细粒度召回父块完整上下文生成分块大小匹配Embedding模型最优窗口兼顾召回精度与上下文完整性高频追问分块大小怎么选有没有通用最优值无通用最优值按内容类型定FAQ类200-500字符制度文档500-1000字符长文知识1000-2000字符核心原则一个块包含一个完整语义单元避免语义断裂和无关信息混杂通过召回率、答案准确率指标调优到最优值表格、图片类内容怎么处理进RAG表格保留行列结构转成结构化Markdown/JSON同时存储文本描述图片OCR提取文字 图片描述生成图文绑定存储复杂图表用多模态Embedding直接向量化配合多模态大模型使用模块三 召回与混合检索核心题1召回准确率低怎么优化混合检索怎么实现背诵要点优化方向查询改写、混合召回、同义词扩展、实体链接、分块优化混合检索流程关键词BM25召回TopK 向量语义召回TopK → 去重合并 → 送入重排核心价值关键词解决精确匹配问题向量解决语义匹配问题互补短板高频追问Query Rewrite有哪些常用方法规则层去标点、归一化、口语转书面语、同义词替换模型层用大模型改写为更标准的检索问句、生成多视角查询进阶多查询生成一个问题拆成多个检索query多路召回合并两路召回结果怎么融合有哪些策略加权融合关键词得分和向量得分按权重相加排序倒数排位融合RRF按两路排名计算综合分鲁棒性强重排融合统一送入Rerank模型做语义排序效果最好召回率和精确率怎么权衡召回阶段优先保召回率宁可多召也不漏召靠后续重排提精度召回TopK设50-100条重排后取Top5-10条进上下文兼顾效果与成本模块四 重排与上下文构建核心题1Rerank的作用是什么全链路性能怎么优化背诵要点作用对初筛结果做精细化语义排序大幅提升顶部相关性是提升RAG效果的性价比最高的环节性能优化控制重排输入数量、选轻量Rerank模型、批量计算、高频结果缓存、高并发可降级跳过高频追问什么时候必须加Rerank什么时候可以不加必须加知识库体量大、查询语义复杂、对答案精度要求高的生产级系统可不加简单FAQ、小体量知识库、Demo原型、对成本极度敏感的场景上下文太长塞不下怎么办控制召回数量只取相关性最高的TopN对长片段做摘要压缩提取核心信息用长上下文模型或分段处理后整合优先保留高置信度、高相关度内容模块五 答案生成与幻觉治理核心题1如何治理大模型幻觉引用溯源怎么实现背诵要点全链路防控检索侧提升召回准确率保证输入知识正确生成侧Prompt强约束、强制引用来源、调低温度校验侧事实一致性校验、置信度打分、低置信度拒答引用溯源每个Chunk分配唯一ID → Prompt要求标注引用编号 → 返回时关联原文信息 → 前端支持跳转定位高频追问拒答阈值怎么定怎么平衡误拒答和漏拒答先标注一批测试数据绘制不同阈值下的准确率和拒答率曲线根据业务场景选平衡点客服场景宁误拒不漏答内部工具宁漏答不幻觉设置中间置信度区间触发二次检索或人工兜底什么是事实一致性校验常用实现方式校验答案和检索上下文是否一致有没有编造信息实现方式小模型分类器、大模型校验、关键词匹配规则、NLI自然语言推理模型模块六 权限隔离与多租户核心题1企业级RAG怎么做权限隔离和数据隔离背诵要点四层防护架构入库打标每个文档/Chunk附带部门、角色、ACL等权限标签检索强制过滤查询时注入权限Filter无权限数据不进入召回池生成前二次校验上下文送入Prompt前再校验一遍审计溯源全链路留痕支持安全审计高频追问多租户用物理隔离还是逻辑隔离怎么选逻辑隔离共用索引加租户ID字段过滤成本低运维简单适合中小租户、安全要求一般物理隔离每个租户独立索引/独立库隔离彻底安全度高适合大客户、数据敏感场景混合方案大客户物理隔离中小客户逻辑隔离只靠Prompt做权限限制为什么不行大模型有指令逃逸风险Prompt注入可绕过约束非确定性输出无法100%保证遵守规则检索层已经拿到了敏感数据泄露风险已经存在核心原则权限控制必须在系统层做Prompt只做辅助模块七 技术选型与底层原理核心题1RAG项目选ES还是Milvus各自适用场景背诵要点ES适合企业级RAG混合检索多、过滤条件多、结构化字段多、已有ES基建中小规模性价比高Milvus适合纯向量检索为主、数据量超亿级、超高QPS向量查询场景专业向量检索性能更强高阶方案双库架构ES做关键词过滤Milvus做向量召回结果融合高频追问Embedding维度越高越好吗怎么选型不是。维度越高语义表达越强但存储、耗时、成本线性上升按场景选短文本简单任务768维通用场景1024维复杂长文本1536维1024维是大多数业务场景的性价比平衡点什么是HNSW索引和IVF比有什么区别HNSW层次化近邻图基于图结构召回率高、查询快内存占用高适合高精度要求IVF倒排文件基于聚类构建快、内存小适合大数据量、可接受稍低召回生产最常用HNSW综合表现最优模块八 性能优化与运维核心题1RAG全链路性能优化有哪些手段背诵要点检索层索引优化、向量量化、冷热分离、热点缓存重排层控制输入数量、轻量模型、批量处理、结果缓存生成层分级路由、流式输出、推理加速、高频问题缓存架构层就近部署、减少网络传输、异步非关键步骤高频追问向量检索慢怎么排查优化先看索引类型是否合适参数是否合理检查是否全量扫描、索引未生效做向量量化压缩减小内存占用增加节点、分片提升并发能力热点查询结果做缓存怎么设计RAG的缓存策略高频标准问题完整答案缓存TTL几小时到几天向量检索结果相同Query的召回结果缓存Embedding结果相同文本的向量缓存避免重复计算缓存Key要包含权限、租户信息防止串数据模块九 评估体系与迭代闭环核心题1怎么做RAG的在线评测和用户反馈闭环背诵要点评测体系自动化指标LLM评测人工抽检三级指标召回率、答案准确率、引用准确率、拒答准确率、响应耗时反馈闭环采集反馈 → 归因分类 → 根因优化 → 回归验证 → 沉淀用例高频追问LLM-as-Judge有什么局限性怎么弥补局限自身有偏见、对细微错误不敏感、打分不稳定、成本高弥补搭配规则校验、多模型交叉评测、校准打分标准、人工抽检金标准RAG效果一直上不去一般排查顺序是什么先看文档质量和分块是否合理再看召回是否漏召、相关性够不够再看重排是否把最相关的排到前面最后看Prompt和生成环节是否有问题模块十 架构演进与扩展核心题1RAG系统怎么支持多模态、多语言未来怎么演进背诵要点多模态多模态Embedding 多模态大模型图文统一检索统一生成多语言多语言Embedding模型 查询翻译 多语言混合检索演进方向从静态检索到Agentic RAG、从单一路径到多路检索融合、从纯文本到全模态、结合知识图谱高频追问什么是Graph RAG和传统向量RAG比有什么优势从文档中提取实体和关系构建知识图谱配合向量检索优势复杂逻辑推理更强、多文档关联能力好、可解释性强适合知识密集型、需要跨文档推理的复杂场景什么是Agentic RAG和普通RAG的区别普通RAG一次检索一次生成被动执行Agentic RAGAgent主动判断信息是否足够自主决定多轮检索、补充查询、信息校验大幅提升复杂问题的回答准确率是RAG的进阶方向第二篇 Agent智能体开发篇模块一 Agent基础与核心原理核心题1什么是AI Agent和普通对话、RAG的核心区别背诵要点定义目标驱动能自主规划、调用工具、迭代反馈的智能体核心是「自主决策外部行动」普通对话被动问答仅依赖模型内置知识无外部能力RAG增强知识库问答本质还是问答模式无自主执行能力Agent目标驱动自主拆任务、调用工具、修正错误可产生真实业务动作核心题2ReAct框架的核心思想和CoT的区别背诵要点ReAct Reasoning推理 Acting行动推理与工具调用交替循环流程思考下一步 → 调用工具 → 基于结果继续推理 → 循环至完成区别CoT是纯内部逻辑推理无法获取外部信息ReAct结合工具可解决知识过时、幻觉问题能完成真实操作核心题3标准Agent由哪些核心模块组成背诵要点大模型推理层大脑负责规划、决策、推理记忆模块会话历史、中间状态、长期知识工具集外部能力入口搜索、数据库、API等规划模块任务拆解、路径规划、异常修正执行层工具调用、结果回传、状态更新反思模块校验结果、自我修正、经验沉淀高频追问Agent必须用大模型吗小模型能不能做Agent不一定。简单流程化Agent、固定工具调用小模型加规则也能实现复杂开放场景、自主规划、灵活推理必须用大模型生产趋势大模型做规划调度小模型做具体执行分层降本Agent规划失败常见原因有哪些怎么优化原因任务理解偏差、工具边界不清晰、缺乏领域知识、异常场景没遇到过优化完善工具描述、加入少样本示例、引入反思机制、预设常见异常分支、人工反馈调优AutoGPT为什么生产落地很少用无边界规划容易死循环和跑偏可控性差Token消耗极高成本不可控任务成功率低稳定性差生产级Agent都是限定场景、明确边界、可控流程模块二 开发框架与选型核心题1主流Agent框架有哪些适用场景分别是什么背诵要点LangGraph/LangChain代码级框架生态最全。LangChain适合简单AgentLangGraph支持复杂状态循环生产级首选Dify国产可视化低代码平台自带RAG与工作流企业快速落地内部AgentCoze字节出品零代码可视化插件生态丰富个人/小团队快速验证DemoAutoGen/CrewAI专攻多Agent协作内置分工模式多角色协同场景核心题2LangGraph和LangChain的核心区别解决什么痛点背诵要点LangChain线性链式执行状态管理弱不支持复杂循环分支适合简单单轮任务LangGraph基于状态机架构原生支持循环、条件分支、人工介入内置持久化状态、断点续跑解决痛点LangChain无法优雅处理Agent思考-行动循环、状态持久化的问题高频追问什么时候用低代码框架什么时候用代码级框架低代码快速验证想法、内部工具、无深度定制、非技术团队代码级生产级复杂场景、深度定制逻辑、复杂工作流、多系统集成、可控性要求高从零手写Agent和用框架比有什么优劣手写灵活度最高、完全可控、无框架依赖、无冗余逻辑开发成本高、重复造轮子框架开发快、生态完善、内置最佳实践有学习成本、API变动快、定制有约束模块三 工具调用与MCP协议核心题1Function Calling完整执行闭环是什么背诵要点四步闭环定义预定义工具Schema功能、参数、返回值决策模型判断是否调用、调用哪个、传什么参数执行业务代码执行工具逻辑获取真实结果回传工具结果返回模型模型继续推理生成最终答案核心题2工具调用常见异常与处理方案背诵要点常见异常参数错误、执行失败、循环调用、幻觉调用不存在的工具、解析失败处理方案参数校验不合法让模型重生成执行失败的错误信息回传让模型修正方案设置最大执行步数检测死循环强制终止工具不可用触发降级切换备用方案核心题3什么是MCP协议核心价值是什么背诵要点定义模型上下文协议Agent对接外部工具的行业标准接口价值一次实现所有支持MCP的Agent都能调用告别重复适配标准化权限、异步任务、UI能力已成行业事实标准主流厂商全适配高频追问工具返回结果太长上下文塞不下怎么办工具侧做分页、截断只返回核心字段对返回结果做摘要压缩提取关键信息让Agent决定需要哪部分信息工具二次查询分多次调用分批处理结果多个无依赖的工具可以并行调用吗怎么实现可以能大幅缩短总耗时实现模型一次性返回多个工具调用指令业务层并行执行全部完成后统一回传给模型注意判断工具间是否有依赖有依赖的必须串行工具调用的幂等性怎么保证每个工具调用生成唯一请求ID工具侧做去重查询类天然幂等写入类加幂等键断点续跑时已执行成功的工具不再重复执行模块四 状态管理与记忆系统核心题1Agent三层记忆架构各自作用与存储方式背诵要点工作记忆当前任务上下文、中间状态程序内存/滑动窗口分钟级短期记忆单会话完整对话历史Redis存储小时-天级长期记忆用户偏好、领域知识、成功经验向量库关系库永久存储原则分层召回控制上下文体积避免信息过载核心题2长对话上下文溢出怎么解决背诵要点滑动窗口只保留最近N轮摘要压缩历史对话做摘要替代原文记忆召回只召回和当前任务相关的片段状态外移执行状态存Redis上下文只留核心推理信息核心题3断点续跑怎么实现背诵要点核心依赖持久化状态存储流程每步执行完持久化当前状态已完成步骤、中间结果→ 中断后读取历史状态 → 从断点继续执行配套工具幂等设计避免重复执行副作用高频追问滑动窗口和摘要压缩各有什么优劣怎么选滑动窗口实现简单、信息无损失长对话会丢失早期关键信息摘要压缩保留全局信息上下文体积小有细节损失、实现复杂选型短对话用滑动窗口长对话用摘要近期滑动窗口结合会话记忆为什么不建议参与检索历史话题会干扰当前检索导致召回偏移指代、省略语会让检索Query不完整最佳实践检索只基于当前问题记忆只辅助生成模块五 多Agent协作核心题1多Agent对比单Agent的优势适用场景背诵要点优势专业分工提质量、并行处理提效率、多视角校验降幻觉、复杂任务可拆解适用场景长流程流水线任务、多领域专业任务、高准确率评审场景、大规模并行任务核心题2常见的多Agent协作模式有哪些背诵要点流水线模式按阶段分工顺序执行适合标准化流程主从调度模式总管Agent调度专业子Agent分配任务整合结果适合复杂开放任务辩论评审模式多Agent输出方案互相评审适合高决策质量场景自由协作模式平等通信协商分工适合科研创意类场景高频追问怎么避免多Agent沟通成本过高、效率反而下降明确职责边界避免职责重叠统一调度器避免点对点混乱通信标准化信息格式减少理解成本控制Agent数量不是越多越好简单任务单Agent更高效多个Agent意见不一致时怎么裁决设主Agent做最终决策投票制多数意见胜出引入评审Agent专门做裁决高风险场景提交人工决策模块六 工程化与性能优化核心题1生产级Agent为什么需要消息队列解决什么痛点背诵要点解决同步执行用户等待久、长耗时任务阻塞线程、系统耦合高的问题价值异步解耦、削峰填谷、自动重试、组件解耦核心题2工作流编排和Agent框架是什么关系什么时候需要背诵要点关系互补而非替代。Agent框架负责智能决策推理工作流负责任务可靠执行工作流核心能力自动重试、超时控制、断点恢复、分布式调度需要场景长耗时多步骤任务、高可靠断点续跑、跨系统协同、定时延迟任务核心题3Agent容灾降级怎么实现背诵要点模型降级主模型不可用切备用模型工具降级核心工具不可用切换备用方案流量削峰高并发时限流排队非核心功能降级熔断机制连续失败触发熔断快速返回避免雪崩高频追问Agent任务执行超时怎么处理设置单步超时和总任务超时超时后触发重试重试失败转降级方案记录超时异常用于后续优化通知用户任务状态避免无响应监控Agent的核心指标有哪些效果类任务成功率、工具调用准确率、异常率性能类平均耗时、首响应时间、Token消耗资源类模型QPS、线程池水位、队列堆积成本类单次任务成本、日总Token消耗大模型API限流时怎么应对消息队列削峰任务排队执行降级为小模型处理简单任务触发限流时返回排队状态给用户配置备用模型池分摊流量模块七 安全与合规核心题1工具调用有哪些安全风险怎么防控背诵要点风险越权操作、恶意代码执行、数据泄露、误操作产生业务损失防控权限最小化只给必需的最小权限代码执行类工具放沙箱运行参数合法性校验过滤恶意内容全操作留痕审计高危操作强制人工确认核心题2什么是人在回路哪些场景必须加背诵要点定义高风险环节暂停执行等待人工确认后再继续必加场景产生真实业务副作用发邮件、改数据、删资源、支付、高风险决策、低置信度场景价值平衡自动化效率与风险降低误操作损失核心题3怎么防御Prompt注入攻击背诵要点分层防御系统Prompt加固明确指令优先级禁止用户指令覆盖系统规则输入检测过滤恶意注入内容工具白名单只能调用预定义工具权限兜底工具本身有权限限制输出校验工具调用前二次校验高频追问Agent生成的SQL怎么防止删库、拖库数据库账号只给只读权限SQL语法校验禁止DROP、DELETE、UPDATE等写操作限制查询行数防止全表扫描拖库执行前人工确认高危查询走专用只读从库不碰主库代码执行沙箱除了Docker还有什么方案Wasm沙箱启动快、资源占用低、隔离性好适合轻量代码执行进程级沙箱限制系统调用、资源配额Serverless函数独立运行环境天然隔离选型轻量短任务用Wasm重任务用Docker模块八 评估体系核心题1Agent评估和传统软件、RAG评估有什么区别背诵要点传统软件输出确定单元测试断言校验RAG评估召回准确率、答案相关性输出相对固定Agent输出非确定、过程多步可变核心评估端到端任务完成度和过程合理性难点路径不唯一、多步误差传导、成功标准难量化核心题2怎么自动化评估Agent任务效果背诵要点方案LLM-as-Judge 规则校验结合构建标准化测试用例集覆盖正常/异常/边界场景自动化执行记录完整执行过程规则校验工具调用正确性、权限合规性大模型评委从任务完成度、逻辑合理性打分每次迭代跑回归测试验证效果不退化高频追问LLM-as-Judge本身有偏见怎么办用更强的模型做评委多模型交叉评测取综合结果制定详细的打分标准和示例减少主观偏差人工抽检校准调整打分prompt任务成功率上不去一般从哪些方向排查先看工具描述是否清晰模型是否理解工具能力再看规划能力任务拆解是否合理再看异常处理遇到错误是否能自我修正最后看记忆和上下文是否完整模块九 实战场景与设计题核心题1Agent陷入死循环怎么检测和处理背诵要点检测最大步数硬限制、相同工具相同参数重复调用检测、无进展状态检测处理触发自我反思重新规划、注入提示引导更换方法、强制终止转人工、记录bad case优化核心题2设计一个自动数据分析Agent核心架构是什么背诵要点五层架构交互层自然语言接收需求流式返回过程结果规划层拆解为数据提取、清洗、分析、可视化子步骤工具层SQL查询、Python代码沙箱、图表生成、文件导出记忆层保存分析上下文、历史经验、数据元信息安全层数据权限过滤、代码沙箱隔离、高危操作人工确认高频追问从零搭建企业级Agent平台整体架构怎么设计接入层API网关、鉴权、限流、SSE流式输出编排层Agent运行时、状态管理、工具调度、工作流引擎能力层模型网关、向量检索、工具市场、记忆服务基建层消息队列、缓存、数据库、可观测、权限系统运营层评估体系、反馈闭环、Prompt管理、数据分析Agent怎么和现有业务系统集成有哪些难点集成方式API对接、数据库对接、前端嵌入、MCP标准协议接入难点权限体系打通、数据安全、业务系统稳定性影响、旧系统无API原则低侵入、可降级、可审计、不影响主业务流程