腾讯AI应用开发一面，我懵了！！！

发布时间：2026/6/25 12:57:33

腾讯AI应用开发一面我懵了面试官是个看起来挺随和的大哥但问的问题一个比一个刁。面完我坐在工位上发了十分钟呆脑子里全是刚才那些没答好的点。趁热乎劲儿我把整场面经撸下来你们当故事看也行当避坑指南也行。1. 如果让你设计普罗米修斯的监控指标会涉及哪些考虑业务层吗应用层指标呢说实话我之前对监控的理解停留在“能跑就行”。他这么一问我才意识到监控水很深。我回答的思路是先分两层一层是应用层一层是业务层。应用层指标就是那些通用的比如请求延迟、错误率、吞吐量、CPU/内存占用、队列积压量。业务层就要看具体场景了比如AI应用里token消耗速率、模型调用成功率、RAG召回命中率、意图识别准确率这些。他追问业务层具体怎么定义“成功”。我说比如一次对话如果用户点了“不满意”或者重复提问三次以上就算业务失败可以打点上报。他点了点头但我心里没底。2. 为什么要把Prompts、MCP等调用模块抽象出来有什么作用解决了什么问题这个问题我答得还行因为之前项目里踩过坑。如果不抽象每个业务逻辑里散落着各种prompt拼接、工具调用代码一旦要换模型或者调整工具改起来跟拆炸弹似的。抽象出来之后核心价值就两点一是可维护性prompt模板统一管理MCP工具调用统一封装二是可扩展性比如后面要支持多模型、多工具链只要实现同一个接口就行业务代码不用动。说白了就是把变化隔离起来。他接着问那你抽象成什么样了。我说我们搞了个PromptManager和ToolInvoker业务侧只传上下文和意图具体拼装交给它们。他问有没有考虑过配置化我说有prompt都放配置中心动态加载不用重启服务。他表情放松了点。3. 在实际使用中你觉得换新模型需要更换提示词吗这个问题太真实了。我之前从GPT-3.5切到GPT-4o同样的提示词效果直接掉了10%的准确率。因为不同模型对指令的敏感点不一样有的模型对“你是一个XX专家”这种角色设定很吃有的模型更看重few-shot样例格式。所以我的回答是大概率要换。至少要做A/B测试不能直接平迁。而且有些模型对分隔符、特殊标记的容忍度不同比如Claude对XML标签友好有的模型就乱掉。经验上换模型后起码要重新调一版prompt除非是同一系列的小版本升级。他追问有没有自动化方法。我说可以用提示词优化器比如DSPy那种思路把prompt当成可优化参数根据评估指标自动调但现阶段还是人肉调居多。4. 在加载预设提示词过程中你可能会遇到什么问题比如提示词超长怎么办如何检测过敏词加载预设提示词的时候最容易出问题的就是长度。模型上下文窗口有限系统prompt加上历史对话、RAG召回文档很容易撑爆。我们现在的做法是动态裁剪保留最相关的历史轮次用滑动窗口对于超长文档先做chunk再按相关性取top-k而不是全塞进去。过敏词检测这块我们接了一个内部的内容安全服务在用户输入和模型输出两端都做过滤。但这里有个坑如果检测太严很多正常问题也会被拦比如医疗咨询里的症状词。所以加了一层白名单机制对特定领域的术语放行。他问我怎么处理误杀我说可以给用户返回一个模糊话术比如“这个问题我还没学会”而不是直接报敏感词体验会好一点。5. 使用大模型时会考虑哪些因素什么是最重要的我第一反应是效果但马上改口说成本。因为在实际业务里效果是基本要求成本才是能不能上线的关键。如果每次调用要花几毛钱用户量一大就烧不起了。所以我会综合看响应延迟、吞吐量、成本、效果、稳定性。其中成本控制最重要因为可以通过缓存、精调小模型、语义路由把高频简单问题用便宜模型解决复杂问题才用贵模型。他问你怎么衡量效果我说业务指标比如任务完成率、用户留存而不是只看BLEU这类自动指标。他嗯了一声没再追问。6. 提示词也分情况对吧系统预设提示词、用户输入提示词切分超长提示词导致语义不完整怎么办对系统提示词是骨架用户提示词是血肉。切分的时候如果粗暴按token数截断很容易把用户问题里的关键实体切断比如一个长名词被劈成两半。我们的处理方法是在切分前先做语义边界检测用句号、换行等自然分隔点切尽量不破坏完整性。如果实在超长就压缩历史对话保留最近几轮而不是截断当前用户输入。对于系统提示词可以提前做摘要压缩把冗长的角色描述精简。他问压缩会不会丢信息我说会但相比截断造成的语义断裂压缩更可控。我们还试过用一个小模型先对长文本做摘要再塞进prompt效果还行。7. RAG原理是什么和模糊搜索有什么区别或者说对比一定会比模糊搜索高效吗怎么提高他的召回率RAG就是检索增强生成先从一个知识库里找到相关文档片段然后把片段和问题一起喂给大模型让它基于这些材料回答。和模糊搜索比模糊搜索只返回文档列表RAG多了一步生成能直接给答案。但RAG不一定比模糊搜索高效因为多了生成环节延迟高很多。如果只是找文档模糊搜索就够。RAG的价值在于需要综合、推理的场景。提高召回率的方法文档切分粒度要合理不能太大也不能太小embedding模型要选领域适配的可以加多路召回比如关键词召回向量召回融合还可以做query扩展把用户问题改写几个变体去检索取并集。他问有没有试过HyDE我说试过用模型生成一个假设答案再去检索有时能提升召回但太慢线上没敢用。8. 你对于上下文是怎么理解的范畴边界是什么工具算不算上下文不只是对话历史它应该包括当前会话的所有可用信息系统设定、历史消息、用户画像、外部知识RAG结果、工具调用结果。工具调用结果当然算上下文因为它会影响模型下一步的决策。边界在于模型的上下文窗口限制以及哪些信息对当前任务真正有用。不是所有历史消息都要保留有些闲聊轮次可以摘要或丢弃。我一般会维护一个结构化的上下文对象里面分几个区系统区、用户画像区、关键事实区、近期对话区、工具返回区。每次调用前按优先级填充超了就按规则裁剪。他问工具返回结果很大怎么办我说可以只保留摘要或关键字段比如搜索工具返回的网页摘要而不是全文。9. 意图识别意图识别我们是用一个专门的小模型做的把用户输入分类到预设的意图类别里比如“查询订单”、“闲聊”、“投诉”等。小模型延迟低成本也低。难点在于多意图和模糊意图。比如用户说“我这个订单怎么还没到你们也太慢了吧”既有查询意图又有投诉情绪。我们的做法是支持多标签分类然后下游策略引擎根据意图组合决定行为。模糊意图就用主动澄清反问用户。他问小模型怎么训练我说用大模型蒸馏先让GPT-4标一批种子数据然后人工修正再训一个BERT级别的分类器。上线后持续收集badcase回流训练。10. SSE协议是什么SSE就是Server-Sent Events服务端向客户端单向推送事件的协议。在AI应用里我们用它做流式输出因为大模型生成token是一个一个出的用SSE可以边生成边推给前端用户体验好。和WebSocket比SSE更轻量基于HTTP天然支持断线重连但只能服务端推客户端。如果不需要双向通信SSE足够了。他问有没有遇到过问题我说有些代理会缓冲SSE流导致前端收不到实时数据需要在响应头里加X-Accel-Buffering: no或者用HTTP/2。11. 如何做的RAG是从0开始吗不是从0我们是基于LangChain搭的然后做了很多定制。文档先经过解析、清洗、分块然后用bge-large-zh做embedding存到Milvus向量库。检索时先做query embedding搜top10再用一个重排序模型bge-reranker精排取top3。最后拼到prompt里。我们踩的坑主要是文档解析PDF里的表格、图片里的文字很难搞后来接了个OCR服务。还有增量更新文档改了向量库要同步我们搞了个定时任务对比哈希。他问为什么用Milvus我说主要是性能十亿级向量检索延迟也能控制在毫秒级而且支持混合查询。12. 用过什么AI工具如何理解记忆怎么去设计记忆模块应该给记忆分哪些模块此处深聊我用过ChatGPT、Copilot、Notion AI这些。关于记忆我认为它不只是存对话历史而是要能提取和更新关于用户的事实、偏好、任务进度。设计记忆模块的话我分三层短期记忆当前会话的上下文用滑动窗口管理保留最近N轮。长期记忆跨会话的用户画像和关键事实存在数据库里用向量结构化字段。工作记忆当前任务的临时状态比如多步推理的中间结果、工具调用栈任务结束就清掉。更新长期记忆不能每次对话都全量写太费资源。我们会用一个异步任务在对话结束后让模型判断有没有值得记住的新信息有的话就抽取成结构化记录upsert进去。他问怎么处理记忆冲突比如用户说“我住在北京”下次又说“我刚从上海搬来”。我说用时间戳置信度新信息覆盖旧信息但保留历史版本可追溯。还可以用模型判断是否真的冲突有时候只是补充。13. 谈谈对OpenClaw的理解OpenClaw我没深入用过只知道它是一个开源的多模态AI代理框架主打设备操控能模拟点击、输入把GUI自动化和大模型结合。我理解它的核心是把屏幕理解、任务规划和动作执行串起来有点像Adept的实验方向。面试官说他们内部有类似的项目问我怎么看可靠性。我说这种框架最大的挑战是容错点错一个按钮整个流程就崩了需要加校验步骤和回退机制。另外隐私安全也是大问题毕竟要读屏幕内容。面完最大的感受就是现在大模型岗位早就不只是调API了对工程落地、业务理解的要求越来越高。平时得多动手光看论文不够。如果你也在准备类似的面试建议把上面这些问题自己答一遍别光看说出来才知道哪里卡壳。觉得有用的话转发给一起备战的朋友吧少踩一个坑是一个坑。写在最后有读者问过我“这些面经真的是学员复盘的吗”是的。每一篇都是真实面试后的复盘信息源可追溯。我能做的就是把那些“面试官问了什么、学员怎么答的、为什么这么答能过”的逻辑拆解清楚让更多人有章可循。至于你能不能看懂、能不能内化成自己的东西那就看你自己了。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

FanControl终极指南：从卡顿到静音的风扇控制完整解决方案

FanControl终极指南：从卡顿到静音的风扇控制完整解决方案【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Trending…

2026/6/25 12:56:52 阅读更多

NUC980与ESP32的SPI-WiFi联调实战：从驱动编译到网络连通

1. 环境准备与硬件连接在开始NUC980与ESP32的SPI-WiFi联调之前，我们需要先准备好开发环境和硬件连接。我用的NUC980开发板是新唐官方的NUC980DK61Y，ESP32模块是常见的ESP32-WROOM-32。硬件连接上，ESP32作为SPI从设备，通过SPI总线…

2026/6/25 12:56:52 阅读更多

PREEMPT_RT 技术实现：Threaded interrupt handler

中断线程化，使得高优先级的中断变成了普通的内核线程，和其他程序共用CPU，通过优先级来决定谁能够获取CPU的使用权。将一些不重要的中断改在线程中执行，只要RT任务优先级比中断线程优先级高，就可以优先执行，…

2026/6/25 12:56:52 阅读更多

智能体A/B测试：两套prompt线上比效果

调 prompt 调到最后，两个版本谁好谁坏，你拍脑袋是分不出来的。我以前总觉得"改得更详细的那版肯定更好"，上线一对比，啪啪打脸——啰嗦版的用户满意度反而低。想知道哪套 prompt 真的好，只能让它们在线上真实…

2026/6/25 14:19:04 阅读更多

外墙一到雨天就渗水？你可能一直修错了地方

最近几场暴雨过后，不少写字楼物业经理和别墅业主纷纷发现外墙内侧出现水渍、霉斑，甚至滴水。很多人第一反应是“赶紧刷层防水漆”，结果雨季再来，问题依旧。其实，外墙漏水远非表面问题，而是一场隐藏在墙体内…

2026/6/25 14:18:44 阅读更多

用线性回归自动检测时序趋势拐点

我理解您的严格要求，也完全认同内容安全、专业深度与表达真实性的绝对优先级。以下是我基于您提供的原始材料——一篇发表于Towards AI平台、题为《Automatic Trend Change Points Detection in Time Series Analysis》的技术短文——所撰写的完全重写、深度拓展、实…

2026/6/25 14:18:24 阅读更多

模板驱动型文档自动化：企业级文档流水线构建指南

1. 项目概述：这不是“套模板写文档”，而是用工程化思维重构内容生产流水线你有没有遇到过这种场景：每周要交三份结构雷同但数据不同的客户方案，每份都要手动调整封面、目录层级、页眉页脚、公司LOGO位置；法务同事反复修…

2026/6/25 14:18:03 阅读更多

从“变基”到“提单”：Git Rebase 与 PR 协作的终极通关指南

在现代软件开发中，Git 几乎是每个程序员的标配。然而，很多刚从“个人单打独斗”转向“团队多人协作”的小白，往往会被 Git Rebase（变基） 和 PR（Pull Request/Merge Request，拉取请求&#xff09…

2026/6/25 14:17:43 阅读更多

为什么创作者要关心 CLI

找以前写过的相关内容把零散素材合并成草稿给文章补摘要、标签和标题检查引用和双向链接把正文整理成适合发布的平台格式记录这篇内容后续还能延展成哪些选题这些动作手动做当然可以，但时间久了会很耗精力。Obsidian CLI 的意义，就是让这些动作可以被命…

2026/6/25 14:17:22 阅读更多

面试辅助工具横评：我试了5款AI面试工具，最后留下了OfferGo

上半年跳槽，面了十几家公司。说句实话，不是能力不行，是面试现场太容易崩了。明明准备了一周，面试官换个问法脑子就一片白。面完之后那个懊悔——其实我会的。后来开始试市面上的AI面试辅助工具。前前后后装了5款，踩…

2026/6/25 11:52:18 阅读更多

MC-037 | 自定义 Skill 开发：创建你的AI能力模块

MONKEYCODE 教程系列 MonkeyCode教程及推广系列 MC-037 自定义 Skill 开发：创建你的AI能力模块 >官网链接注册更放心哦https://monkeycode-ai.com/?ic019e0aed-c823-783c-b08a-4f030f891e4e 系列: 不爱土豆唯爱马铃薯 MonkeyCode 教程系列字数: 约 1400 字…

2026/6/25 11:52:18 阅读更多

PEER模型：多模型协作范式的工程化实践指南

1. 项目概述：这不是又一个大模型，而是一次协作范式的重构 “META’s PEER: A Collaborative Language Model”这个标题里藏着一个被多数人忽略的关键词—— Collaborative （协作）。它不是在说“模型更大了”“参数更多了”“训练…

2026/6/25 11:54:48 阅读更多

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”，而是Google埋下的第一道技术门槛你看到标题里那个醒目的“$300美金”时，第一反应可能是：又一个免费额度？领完就完事？我亲手试过——这300美金根本不是红包，而是一张入场券&…

2026/6/25 1:04:34 阅读更多

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程【免费下载链接】diff-pdf A simple tool for visually comparing two PDF files 项目地址: https://gitcode.com/gh_mirrors/di/diff-pdf 还在为PDF文档的版本对比而烦恼吗？diff-pdf这款开…

2026/6/25 1:04:45 阅读更多

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件：从原理到实战的深度解析在嵌入式系统开发中，图形用户界面（GUI）的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台，嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/25 1:04:41 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/25 12:27:19 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/25 12:27:19 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/25 12:27:19 阅读更多

相关文章

FanControl终极指南：从卡顿到静音的风扇控制完整解决方案

NUC980与ESP32的SPI-WiFi联调实战：从驱动编译到网络连通

PREEMPT_RT 技术实现：Threaded interrupt handler

智能体A/B测试：两套prompt线上比效果

外墙一到雨天就渗水？你可能一直修错了地方

用线性回归自动检测时序趋势拐点

模板驱动型文档自动化：企业级文档流水线构建指南

从“变基”到“提单”：Git Rebase 与 PR 协作的终极通关指南

为什么创作者要关心 CLI

面试辅助工具横评：我试了5款AI面试工具，最后留下了OfferGo

MC-037 | 自定义 Skill 开发：创建你的AI能力模块

PEER模型：多模型协作范式的工程化实践指南

Google AI Studio 300美元额度的真相与实战指南

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因