腾讯AI应用开发一面,我懵了!!! 腾讯AI应用开发一面我懵了面试官是个看起来挺随和的大哥但问的问题一个比一个刁。面完我坐在工位上发了十分钟呆脑子里全是刚才那些没答好的点。趁热乎劲儿我把整场面经撸下来你们当故事看也行当避坑指南也行。1. 如果让你设计普罗米修斯的监控指标会涉及哪些考虑业务层吗应用层指标呢说实话我之前对监控的理解停留在“能跑就行”。他这么一问我才意识到监控水很深。我回答的思路是先分两层一层是应用层一层是业务层。应用层指标就是那些通用的比如请求延迟、错误率、吞吐量、CPU/内存占用、队列积压量。业务层就要看具体场景了比如AI应用里token消耗速率、模型调用成功率、RAG召回命中率、意图识别准确率这些。他追问业务层具体怎么定义“成功”。我说比如一次对话如果用户点了“不满意”或者重复提问三次以上就算业务失败可以打点上报。他点了点头但我心里没底。2. 为什么要把Prompts、MCP等调用模块抽象出来有什么作用解决了什么问题这个问题我答得还行因为之前项目里踩过坑。如果不抽象每个业务逻辑里散落着各种prompt拼接、工具调用代码一旦要换模型或者调整工具改起来跟拆炸弹似的。抽象出来之后核心价值就两点一是可维护性prompt模板统一管理MCP工具调用统一封装二是可扩展性比如后面要支持多模型、多工具链只要实现同一个接口就行业务代码不用动。说白了就是把变化隔离起来。他接着问那你抽象成什么样了。我说我们搞了个PromptManager和ToolInvoker业务侧只传上下文和意图具体拼装交给它们。他问有没有考虑过配置化我说有prompt都放配置中心动态加载不用重启服务。他表情放松了点。3. 在实际使用中你觉得换新模型需要更换提示词吗这个问题太真实了。我之前从GPT-3.5切到GPT-4o同样的提示词效果直接掉了10%的准确率。因为不同模型对指令的敏感点不一样有的模型对“你是一个XX专家”这种角色设定很吃有的模型更看重few-shot样例格式。所以我的回答是大概率要换。至少要做A/B测试不能直接平迁。而且有些模型对分隔符、特殊标记的容忍度不同比如Claude对XML标签友好有的模型就乱掉。经验上换模型后起码要重新调一版prompt除非是同一系列的小版本升级。他追问有没有自动化方法。我说可以用提示词优化器比如DSPy那种思路把prompt当成可优化参数根据评估指标自动调但现阶段还是人肉调居多。4. 在加载预设提示词过程中你可能会遇到什么问题比如提示词超长怎么办如何检测过敏词加载预设提示词的时候最容易出问题的就是长度。模型上下文窗口有限系统prompt加上历史对话、RAG召回文档很容易撑爆。我们现在的做法是动态裁剪保留最相关的历史轮次用滑动窗口对于超长文档先做chunk再按相关性取top-k而不是全塞进去。过敏词检测这块我们接了一个内部的内容安全服务在用户输入和模型输出两端都做过滤。但这里有个坑如果检测太严很多正常问题也会被拦比如医疗咨询里的症状词。所以加了一层白名单机制对特定领域的术语放行。他问我怎么处理误杀我说可以给用户返回一个模糊话术比如“这个问题我还没学会”而不是直接报敏感词体验会好一点。5. 使用大模型时会考虑哪些因素什么是最重要的我第一反应是效果但马上改口说成本。因为在实际业务里效果是基本要求成本才是能不能上线的关键。如果每次调用要花几毛钱用户量一大就烧不起了。所以我会综合看响应延迟、吞吐量、成本、效果、稳定性。其中成本控制最重要因为可以通过缓存、精调小模型、语义路由把高频简单问题用便宜模型解决复杂问题才用贵模型。他问你怎么衡量效果我说业务指标比如任务完成率、用户留存而不是只看BLEU这类自动指标。他嗯了一声没再追问。6. 提示词也分情况对吧系统预设提示词、用户输入提示词切分超长提示词导致语义不完整怎么办对系统提示词是骨架用户提示词是血肉。切分的时候如果粗暴按token数截断很容易把用户问题里的关键实体切断比如一个长名词被劈成两半。我们的处理方法是在切分前先做语义边界检测用句号、换行等自然分隔点切尽量不破坏完整性。如果实在超长就压缩历史对话保留最近几轮而不是截断当前用户输入。对于系统提示词可以提前做摘要压缩把冗长的角色描述精简。他问压缩会不会丢信息我说会但相比截断造成的语义断裂压缩更可控。我们还试过用一个小模型先对长文本做摘要再塞进prompt效果还行。7. RAG原理是什么和模糊搜索有什么区别或者说对比一定会比模糊搜索高效吗怎么提高他的召回率RAG就是检索增强生成先从一个知识库里找到相关文档片段然后把片段和问题一起喂给大模型让它基于这些材料回答。和模糊搜索比模糊搜索只返回文档列表RAG多了一步生成能直接给答案。但RAG不一定比模糊搜索高效因为多了生成环节延迟高很多。如果只是找文档模糊搜索就够。RAG的价值在于需要综合、推理的场景。提高召回率的方法文档切分粒度要合理不能太大也不能太小embedding模型要选领域适配的可以加多路召回比如关键词召回向量召回融合还可以做query扩展把用户问题改写几个变体去检索取并集。他问有没有试过HyDE我说试过用模型生成一个假设答案再去检索有时能提升召回但太慢线上没敢用。8. 你对于上下文是怎么理解的范畴边界是什么工具算不算上下文不只是对话历史它应该包括当前会话的所有可用信息系统设定、历史消息、用户画像、外部知识RAG结果、工具调用结果。工具调用结果当然算上下文因为它会影响模型下一步的决策。边界在于模型的上下文窗口限制以及哪些信息对当前任务真正有用。不是所有历史消息都要保留有些闲聊轮次可以摘要或丢弃。我一般会维护一个结构化的上下文对象里面分几个区系统区、用户画像区、关键事实区、近期对话区、工具返回区。每次调用前按优先级填充超了就按规则裁剪。他问工具返回结果很大怎么办我说可以只保留摘要或关键字段比如搜索工具返回的网页摘要而不是全文。9. 意图识别意图识别我们是用一个专门的小模型做的把用户输入分类到预设的意图类别里比如“查询订单”、“闲聊”、“投诉”等。小模型延迟低成本也低。难点在于多意图和模糊意图。比如用户说“我这个订单怎么还没到你们也太慢了吧”既有查询意图又有投诉情绪。我们的做法是支持多标签分类然后下游策略引擎根据意图组合决定行为。模糊意图就用主动澄清反问用户。他问小模型怎么训练我说用大模型蒸馏先让GPT-4标一批种子数据然后人工修正再训一个BERT级别的分类器。上线后持续收集badcase回流训练。10. SSE协议是什么SSE就是Server-Sent Events服务端向客户端单向推送事件的协议。在AI应用里我们用它做流式输出因为大模型生成token是一个一个出的用SSE可以边生成边推给前端用户体验好。和WebSocket比SSE更轻量基于HTTP天然支持断线重连但只能服务端推客户端。如果不需要双向通信SSE足够了。他问有没有遇到过问题我说有些代理会缓冲SSE流导致前端收不到实时数据需要在响应头里加X-Accel-Buffering: no或者用HTTP/2。11. 如何做的RAG是从0开始吗不是从0我们是基于LangChain搭的然后做了很多定制。文档先经过解析、清洗、分块然后用bge-large-zh做embedding存到Milvus向量库。检索时先做query embedding搜top10再用一个重排序模型bge-reranker精排取top3。最后拼到prompt里。我们踩的坑主要是文档解析PDF里的表格、图片里的文字很难搞后来接了个OCR服务。还有增量更新文档改了向量库要同步我们搞了个定时任务对比哈希。他问为什么用Milvus我说主要是性能十亿级向量检索延迟也能控制在毫秒级而且支持混合查询。12. 用过什么AI工具如何理解记忆怎么去设计记忆模块应该给记忆分哪些模块此处深聊我用过ChatGPT、Copilot、Notion AI这些。关于记忆我认为它不只是存对话历史而是要能提取和更新关于用户的事实、偏好、任务进度。设计记忆模块的话我分三层短期记忆当前会话的上下文用滑动窗口管理保留最近N轮。长期记忆跨会话的用户画像和关键事实存在数据库里用向量结构化字段。工作记忆当前任务的临时状态比如多步推理的中间结果、工具调用栈任务结束就清掉。更新长期记忆不能每次对话都全量写太费资源。我们会用一个异步任务在对话结束后让模型判断有没有值得记住的新信息有的话就抽取成结构化记录upsert进去。他问怎么处理记忆冲突比如用户说“我住在北京”下次又说“我刚从上海搬来”。我说用时间戳置信度新信息覆盖旧信息但保留历史版本可追溯。还可以用模型判断是否真的冲突有时候只是补充。13. 谈谈对OpenClaw的理解OpenClaw我没深入用过只知道它是一个开源的多模态AI代理框架主打设备操控能模拟点击、输入把GUI自动化和大模型结合。我理解它的核心是把屏幕理解、任务规划和动作执行串起来有点像Adept的实验方向。面试官说他们内部有类似的项目问我怎么看可靠性。我说这种框架最大的挑战是容错点错一个按钮整个流程就崩了需要加校验步骤和回退机制。另外隐私安全也是大问题毕竟要读屏幕内容。面完最大的感受就是现在大模型岗位早就不只是调API了对工程落地、业务理解的要求越来越高。平时得多动手光看论文不够。如果你也在准备类似的面试建议把上面这些问题自己答一遍别光看说出来才知道哪里卡壳。觉得有用的话转发给一起备战的朋友吧少踩一个坑是一个坑。写在最后有读者问过我“这些面经真的是学员复盘的吗”是的。每一篇都是真实面试后的复盘信息源可追溯。我能做的就是把那些“面试官问了什么、学员怎么答的、为什么这么答能过”的逻辑拆解清楚让更多人有章可循。至于你能不能看懂、能不能内化成自己的东西那就看你自己了。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】