1. 从一句《论语》引发的管理反思“哀公问弟子孰为好学子对曰有颜回者好学不迁怒不贰过。不幸短命死矣今也则亡未闻好学者也。”这段出自《论语·雍也》的对话相信很多人都读过。字面意思很简单鲁哀公问孔子你的学生里谁最好学孔子回答是颜回。他好学能做到不把怒气转移到别人身上不犯同样的错误。可惜他短命死了现在没有这样的人了再没听说过谁是好学的。在很长一段时间里我对“不迁怒不贰过”的理解也停留在个人修养的层面觉得这是一种极高的道德自律。直到自己开始带团队从技术骨干转型为项目负责人、部门主管在无数个因为项目延期、产品bug、客户投诉而焦头烂额的夜晚我才真正体会到这六个字在管理实践中的千钧之重。它不再是一句轻飘飘的古训而是决定团队氛围、执行效率乃至项目成败的“高压线”。尤其在技术驱动的行业无论是我们熟悉的FPGA/CPLD开发、MCU嵌入式系统设计还是复杂的汽车电子、物联网项目一个产品的成功交付背后是硬件工程师、软件工程师、测试工程师、供应链管理等多环节的精密协作。任何一个环节的失误都可能导致连锁反应。当问题出现时作为主管或老板我们的第一反应是什么是立刻拍桌子质问“这是谁干的”还是能先稳住情绪把“追责”的冲动压下去把“解决”的优先级提上来我见过太多这样的场景一个关键节点上的代码提交引发了线上故障项目经理在晨会上对着负责的开发工程师劈头盖脸一顿骂指责其不严谨、不测试。会后私下了解才发现是因为上游的需求在评审会后临时口头变更没有同步更新文档开发工程师基于旧文档实现而测试用例也未能覆盖这个隐性的变更点。责任在谁看似是开发的“低级错误”根源却在需求管理的流程缺失和沟通失效。如果主管只迁怒于最后执行的那个人真正的问题就被掩盖了下次还会在别处爆发。所以今天我想结合自己十几年在技术与管理交叉路口的摸爬滚打聊聊“不迁怒”这三个字。它不是什么高深的管理学理论就是一个管理者在面对问题时能否守住的那条底线。这条底线之上是信任、是担当、是团队战斗力这条底线之下便是推诿、内耗和沉默的崩溃。2. “迁怒”的隐蔽性与破坏力为什么我们总是不自觉地把锅甩出去“迁怒”这个词很有意思它的重点在于“迁”——转移。怒火本身或许有正当缘由比如项目严重delay延迟客户愤怒投诉关键实验数据对不上。但问题在于当这股火气没有对准问题的根源而是图方便、凭情绪地“迁移”到了一个更容易、更安全的目标身上时管理就失效了。2.1 技术管理中的典型“迁怒”场景在我们工程师的日常里“迁怒”往往穿着各种“合理化”的外衣出现极具隐蔽性。场景一结果导向的粗暴归因。“PCB板子回来焊接完功能测试不通硬件工程师怎么画的图”——这是最常见的一种。功能不通直接归咎于硬件设计。但仔细排查可能发现是采购为了降本换了未经认证的阻容器件批次导致参数漂移或者是固件工程师在最后关头为了赶进度修改了一段底层驱动代码没有通知硬件团队做信号完整性复查。主管如果只盯着“硬件画错了”这个表面结论发火硬件工程师委屈真正的问题点供应链质量控制、跨团队变更流程却被忽略。场景二压力传导下的“替罪羊”。老板因为一个大客户催货给了研发总监巨大压力。研发总监转身就对项目经理吼“我不管什么原因周五之前必须解决所有bug”项目经理承受不住在站会上就对着测试组长发难“为什么测了这么久还有漏测测试用例怎么写的”压力一层层下压最终可能落在一个刚入职的测试工程师头上他被迫承担了“测试不力”的罪名。但实际上可能是开发自测环节缺失提交的版本质量太差也可能是需求本身模糊导致测试无法有效覆盖。场景三维护权威的“甩锅”行为。这在向上汇报时尤其明显。比如向老板或客户演示新产品原型现场突然死机。主管可能会立刻说“小张你是不是昨晚改的代码没经过测试就合入了” 在公开场合迅速指出一个具体下级的“错误”有时被管理者潜意识里视为展现自己洞察力和控制力的方式。即使事后查明是演示环境的外设兼容性问题或者根本就是主管自己之前决策采用的某个廉价芯片的稳定性缺陷那句当众的指责已经造成了伤害。2.2 “迁怒”如何系统性摧毁团队一次两次的迁怒或许会被理解为“领导脾气急”。但如果它成为一种团队文化或管理习惯其破坏力是系统性的。首先扼杀坦诚沟通与问题上报。团队成员会迅速学会“多一事不如少一事”。遇到潜在风险或小失误他们的第一反应不再是报告和求助而是掩盖和祈祷别在自己手上爆雷。因为上报问题等于引火烧身。在嵌入式开发中一个驱动里的警告warning没处理可能埋下重启的隐患。如果工程师曾因上报类似“小问题”而被斥为“能力不足”、“吹毛求疵”他下次就会选择沉默。最终小问题酿成大事故。其次导致责任体系的扭曲和失效。健康的责任体系是“对事负责”追溯问题根源完善流程。迁怒文化下的责任体系是“对人负责”重点是找到一个能承担骂名的个体。这会导致大家热衷于“划清界限”和“保留证据”而不是通力合作解决问题。在需要软硬件紧密协同的物联网项目里这种“各扫门前雪”的心态是致命的。最后损耗团队最宝贵的资产信任与士气。工程师尤其是优秀的工程师内心通常有极强的自尊和对专业的荣誉感。他们可以接受因自己技术判断失误而导致的批评但无法接受成为上级情绪或流程缺陷的替罪羊。一旦感到不公他们的选择往往是“离心”和“躺平”最直接的损失就是创造力和工作热情的熄灭。招聘和培养一个优秀的射频工程师或算法工程师成本极高而赶走他只需要几次不公正的迁怒就够了。注意识别迁怒不能只看管理者是否发了火。关键判别标准是批评指责的对象是否是导致问题的主要原因或唯一责任人如果批评指向了次要责任方或无辜者或者用对个人的指责替代了对系统性根因的剖析那就是迁怒。3. 如何做到“不迁怒”一套可操作的管理者行动指南知道了迁怒的危害那具体该怎么避免这绝不是一句“你要控制情绪”的鸡汤就能解决的。它需要管理者建立一套从思维习惯到行为模式的系统方法。结合我的经验可以分解为以下四个步骤。3.1 第一步按下“暂停键”建立问题响应缓冲期当坏消息传来无论是测试报告上一片红色还是客户打来投诉电话人的本能反应是应激的血液涌向大脑情绪主导思维。这个时候做出的判断和说出的话大概率是感性的、攻击性的。实操方法强制物理隔离与冷静程序。立即离开现场或沟通界面如果是当面汇报可以说“情况我了解了给我10分钟我们稍后在小会议室详细讨论。”如果是线上消息不要马上回复特别是不要在一连串的追问下仓促回复。起身去倒杯水去走廊走一圈。进行“三问”自检在冷静的几分钟里快速问自己三个问题第一问我的情绪现在是什么状态是愤怒、焦虑还是失望第二问这个情绪主要是由问题本身引发的还是由其他压力如老板施压、个人事务传导过来的第三问我即将要做出的反应比如批评某人目标是解决问题还是宣泄我当下的情绪转换问题陈述句式把“你怎么又搞砸了”这种指责性语言在脑子里转换成“我们遇到了一个XX问题目前的影响是YYY我们需要一起看看哪里出了岔子。” 把主语从“你”换成“我们”把“搞砸了”这种定性词换成对客观问题的描述。这个缓冲期是管理者从“情绪动物”回归“理性人”的关键。尤其在处理像芯片流片失败、重大安全漏洞这类高压事件时这十分钟的冷静可能价值千万。3.2 第二步开展“根因分析”而非“责任审判”情绪平稳后要立即启动对问题本身的调查。这里的核心是要把会议桌当成“手术台”而不是“法庭”。我们的目的是解剖问题找到病根而不是审判犯人。实操方法采用技术团队熟悉的“5Why分析法”或“鱼骨图”进行复盘。召集相关责任人注意是“相关责任人”而不是“疑似肇事者”开一个复盘会。会议基调必须是“今天不开批斗会只开复盘会。我们的唯一目标是搞清楚事情是怎么发生的以及如何防止再发生。”引导大家按照以下逻辑展开现象层发生了什么问题例如智能硬件设备在低温环境下概率性死机。技术层直接的技术原因是什么例如看门狗Watchdog电路在低温下触发复位的时间参数漂移。流程层为什么这个技术原因没有被发现例如硬件测试用例库中没有覆盖-20°C的低温看门狗专项测试项高低温测试报告评审时大家只关注了主要功能忽略了电源监控模块的细节。系统层为什么流程会缺失例如公司的硬件测试规范是从消费电子产品沿袭过来的对工业级或车规级应用的极端环境测试要求定义不完整项目周期紧张测试阶段被压缩一些“非典型”测试被裁减。文化层为什么系统允许这种情况发生例如公司文化更鼓励“快速上线、快速迭代”对“稳健可靠”的重视程度不足在资源分配上总是向新功能开发倾斜测试和质保资源长期紧张。通过这样一层层追问你会发现一个简单的“设备死机”最后可能指向测试规范、资源分配甚至公司战略导向的问题。那个硬件工程师可能只是在有缺陷的流程和紧张的资源下完成了他认为“正确”的工作。这时你还忍心把怒火全部倾泻到他一个人身上吗3.3 第三步明确责任归属但聚焦“改进”而非“惩罚”不迁怒不等于“和稀泥”不等于没有责任。责任必须清晰否则团队就会失去准绳。关键在于明确责任的目的是为了改进和预防而不是为了惩罚和羞辱。实操方法区分“执行责任”与“领导责任”公开承担。在根因分析清楚后责任通常会呈现一个谱系直接执行责任工程师A在编写某段驱动代码时未严格遵循代码规范留下了隐患。监督审核责任技术主管B在代码Review时没有发现这个隐患。流程保障责任项目经理C制定的开发计划过于激进挤占了必要的自测和Review时间。最终领导责任作为部门负责人的我默许了这种“重进度、轻质量”的氛围也没有为团队争取到更合理的资源。在复盘会上我应该首先公开承认自己的领导责任“这个问题的发生首要责任在我。我对于项目质量的重视只停留在口头上在资源紧张时首先妥协的往往是测试和评审时间这个导向是错误的。” 然后再依次厘清项目经理、技术主管和工程师的责任。对于工程师A批评应该是对事不对人的、建设性的“你这次在drv_sensor.c的第203行使用的延时函数没有考虑中断嵌套场景这违反了我们的编码安全准则第3条。这反映出你对这条准则的理解还不够深或者当时太匆忙了。接下来你需要和B主管一起重新学习这条准则并在下周的组会上分享一个正确的案例。同时你负责修正这个bug并补充相应的单元测试。”这样的处理责任清晰但指向是改进学习准则、修正bug、补充测试而非单纯的惩罚扣奖金、公开羞辱。当事人知道自己错在哪、如何改团队也看到了一个公正、有担当的处理方式。3.4 第四步推动闭环与改进将教训转化为团队资产复盘和追责的终点不是处分某个人而是要让团队和组织变得更强。必须形成一个闭环把这次事故的教训固化到流程、规范或检查表中避免“贰过”。实操方法生成“改进措施清单”并跟踪。复盘会议的最后必须产出一张明确的改进措施清单Action Items并指定负责人和完成时间。例如序号问题根因改进措施负责人完成时间状态1硬件测试规范缺少极端环境细分项修订《硬件测试用例设计规范》增加高低温、高低压等环境下对各电源监控、复位电路的专项测试要求。测试经理下月末进行中2代码Review流于形式未覆盖关键安全代码建立关键模块如驱动、中断处理的强制双人Review机制并制定Checklist。技术总监两周内待启动3项目计划未为质保活动留足时间修改项目计划模板强制要求将测试用例设计、评审、执行时间单独列出占比不低于总时间的30%。项目管理部下季度已规划4工程师对编码安全准则理解不深组织一次全部门的编码安全准则培训并安排一次考试。当事人A 主管B一个月内已安排这张表就是团队用一次错误换来的宝贵资产。管理者我的任务就是定期跟踪这些措施的落地情况。当下次类似项目启动时这些改进就应该已经生效从而从根本上降低同类问题发生的概率。这才是“不贰过”在组织层面的体现。4. 管理者自身的修养承认错误是力量的开始做到上面这些流程性的东西需要方法。但支撑这些方法能够被执行下去的是管理者内心的修养。其中最反人性、也最关键的一点就是公开承认自己的错误。我在文章开头提到的那个深圳大学论坛的例子就是一个深刻的教训。把PPT错别字归咎于秘书是几乎不假思索的本能反应。因为那能最快地维护自己“认真严谨”的形象。但孔子的话像一记耳光打醒了我你在讲“不迁怒”自己却在现场完美演绎了什么是“迁怒”。当我当众承认“主要责任在我”并为此向听众鞠躬时我担心的“权威扫地”并没有发生反而收获了掌声。那掌声让我明白团队成员和外界尊重一个管理者不是因为他永远正确而是因为他足够真实、足够担当。承认错误并不会削弱权威通过展现理性、负责和诚信管理者实际上在构建更坚实、基于尊重的权威。这对于技术出身的管理者尤其重要。我们习惯了用代码和电路说话对就是对错就是错。但在管理上这种“二进制思维”有时会让我们拉不下面子。我们会觉得“我是主管我承认错了以后还怎么管人” 事实恰恰相反。当你坦诚地说“上次关于架构选型的决策我判断有误给大家后续开发带来了麻烦我们接下来需要调整。” 团队听到的潜台词是“我的老板是讲道理的、是客观的、是可以沟通的。” 这种安全感会极大促进团队敢于提出不同意见敢于报告坏消息从而避免更大的决策失误。实操心得培养“认错”的习惯可以从一些小处开始。比如在周会上主动说“上周我催大家赶工语气急了方式不对给大家压力了抱歉。” 或者在一个技术讨论后说“刚才我坚持的那个方案经过大家的讨论确实不如小李提出的方案更优是我考虑不周按小李的方案执行。” 这些小动作会在团队中悄然播下“心理安全”的种子。5. 平衡的艺术不迁怒不等于做“老好人”讨论到这里必须警惕另一个极端为了避免“迁怒”的恶名管理者变得畏首畏尾不敢批评不敢问责当“老好人”。这是对“不迁怒”的严重误解。“不迁怒”的对面是“明赏罚”。一个健康的团队必须要有清晰的边界和标准。对于确实因玩忽职守、重复低级错误、违背职业道德而造成的损失必须进行严厉、公正的处罚。关键在于区分“能力问题”、“流程问题”和“态度问题”。能力问题员工很努力但因知识、经验所限未能做好。处理方式培训、辅导、调整岗位或任务。管理者应承担“培养不力”的责任。流程问题员工按既有流程操作但流程本身有缺陷导致问题。处理方式优化流程不处罚员工。管理者应承担“流程设计/维护不力”的责任。态度问题员工有能力和条件做好却因懈怠、马虎、违背明确指令而犯错。处理方式批评教育依规处罚。这是员工应承担的主要责任。例如一个嵌入式软件工程师因为对实时操作系统RTOS的优先级反转机制理解不深设计了一个有潜在死锁风险的任务通信模块这属于能力问题。应该安排资深工程师对他进行培训并加强代码审查。但如果公司明明有严格的《代码提交规范》要求所有提交必须附带测试用例他为了图方便多次绕过规范直接提交最终引发集成测试失败这就是态度问题。对此必须提出严肃批评并依据制度给予相应处理。所以“不迁怒”的真谛是追求公正而不是追求仁慈。它要求管理者像一位严谨的工程师调试电路一样精准地定位问题的根源是元器件参数不对、是电路设计有误、还是外部干扰太大然后针对性地采取措施更换元件、修改设计、增加屏蔽而不是简单地用锤子砸一遍电路板了事。6. 构建“不迁怒”的团队文化从管理者到整个系统个人的修养和单次事件的处理是基础。但要真正让“不迁怒”成为团队基因需要上升到文化层面进行系统建设。首先管理者要成为文化的“活样板”。言传身教永远是最有力的。当你每一次都能在问题面前保持冷静、主持公道、主动担责你的团队就会慢慢相信这里真的是一个“对事不对人”的环境。他们会开始模仿这种处理问题的方式。其次建立“无责备复盘”Blameless Postmortem机制。在重大技术故障如线上事故、重大质量缺陷处理后强制推行“无责备复盘会”。会议的核心规则就是在复盘期间禁止任何针对个人的指责只关注事实、时间线和系统原因。鼓励所有人无论层级高低畅所欲言。会议产出不是追责名单而是前面提到的“改进措施清单”。谷歌、亚马逊等公司在这方面有非常成熟的实践可以借鉴。再次在绩效考核中纳入“协作”与“担当”维度。除了考核个人业绩如完成了多少功能、解决了多少bug还要考核他在团队协作中的表现。例如是否主动分享知识是否在同事遇到困难时提供帮助是否敢于在项目中提出风险和问题是否在出现失误时能坦诚面对并积极补救通过绩效这个指挥棒引导大家关注集体成功和系统优化。最后保护那些“报忧”的人。要公开表扬和奖励那些主动报告问题、揭露隐患的员工即使他们报告的问题是他们自己造成的。树立“发现问题就是贡献”的价值观。可以设立“最佳啄木鸟奖”、“风险预警奖”等让团队看到说真话、报实情不仅不会受罚还会受到鼓励。管理归根结底是“管人理事”。技术会迭代产品会更新但一个团队面对压力、面对错误时的反应模式决定了它能走多远。“不迁怒”这三个字像一颗定盘星稳住的是管理者的心照见的是问题的本相最终凝聚起的是一个有信任、有担当、能打硬仗的团队。它或许不能让你立刻解决一个技术难题但它能保证当难题出现时你身边是一群愿意和你一起冷静分析、共同担当的伙伴而不是一群时刻准备着躲避枪口的惊弓之鸟。这才是管理者最核心的修为也是最宝贵的财富。
技术管理者如何践行“不迁怒”:从情绪管理到系统改进的实践指南
发布时间:2026/6/7 21:58:23
1. 从一句《论语》引发的管理反思“哀公问弟子孰为好学子对曰有颜回者好学不迁怒不贰过。不幸短命死矣今也则亡未闻好学者也。”这段出自《论语·雍也》的对话相信很多人都读过。字面意思很简单鲁哀公问孔子你的学生里谁最好学孔子回答是颜回。他好学能做到不把怒气转移到别人身上不犯同样的错误。可惜他短命死了现在没有这样的人了再没听说过谁是好学的。在很长一段时间里我对“不迁怒不贰过”的理解也停留在个人修养的层面觉得这是一种极高的道德自律。直到自己开始带团队从技术骨干转型为项目负责人、部门主管在无数个因为项目延期、产品bug、客户投诉而焦头烂额的夜晚我才真正体会到这六个字在管理实践中的千钧之重。它不再是一句轻飘飘的古训而是决定团队氛围、执行效率乃至项目成败的“高压线”。尤其在技术驱动的行业无论是我们熟悉的FPGA/CPLD开发、MCU嵌入式系统设计还是复杂的汽车电子、物联网项目一个产品的成功交付背后是硬件工程师、软件工程师、测试工程师、供应链管理等多环节的精密协作。任何一个环节的失误都可能导致连锁反应。当问题出现时作为主管或老板我们的第一反应是什么是立刻拍桌子质问“这是谁干的”还是能先稳住情绪把“追责”的冲动压下去把“解决”的优先级提上来我见过太多这样的场景一个关键节点上的代码提交引发了线上故障项目经理在晨会上对着负责的开发工程师劈头盖脸一顿骂指责其不严谨、不测试。会后私下了解才发现是因为上游的需求在评审会后临时口头变更没有同步更新文档开发工程师基于旧文档实现而测试用例也未能覆盖这个隐性的变更点。责任在谁看似是开发的“低级错误”根源却在需求管理的流程缺失和沟通失效。如果主管只迁怒于最后执行的那个人真正的问题就被掩盖了下次还会在别处爆发。所以今天我想结合自己十几年在技术与管理交叉路口的摸爬滚打聊聊“不迁怒”这三个字。它不是什么高深的管理学理论就是一个管理者在面对问题时能否守住的那条底线。这条底线之上是信任、是担当、是团队战斗力这条底线之下便是推诿、内耗和沉默的崩溃。2. “迁怒”的隐蔽性与破坏力为什么我们总是不自觉地把锅甩出去“迁怒”这个词很有意思它的重点在于“迁”——转移。怒火本身或许有正当缘由比如项目严重delay延迟客户愤怒投诉关键实验数据对不上。但问题在于当这股火气没有对准问题的根源而是图方便、凭情绪地“迁移”到了一个更容易、更安全的目标身上时管理就失效了。2.1 技术管理中的典型“迁怒”场景在我们工程师的日常里“迁怒”往往穿着各种“合理化”的外衣出现极具隐蔽性。场景一结果导向的粗暴归因。“PCB板子回来焊接完功能测试不通硬件工程师怎么画的图”——这是最常见的一种。功能不通直接归咎于硬件设计。但仔细排查可能发现是采购为了降本换了未经认证的阻容器件批次导致参数漂移或者是固件工程师在最后关头为了赶进度修改了一段底层驱动代码没有通知硬件团队做信号完整性复查。主管如果只盯着“硬件画错了”这个表面结论发火硬件工程师委屈真正的问题点供应链质量控制、跨团队变更流程却被忽略。场景二压力传导下的“替罪羊”。老板因为一个大客户催货给了研发总监巨大压力。研发总监转身就对项目经理吼“我不管什么原因周五之前必须解决所有bug”项目经理承受不住在站会上就对着测试组长发难“为什么测了这么久还有漏测测试用例怎么写的”压力一层层下压最终可能落在一个刚入职的测试工程师头上他被迫承担了“测试不力”的罪名。但实际上可能是开发自测环节缺失提交的版本质量太差也可能是需求本身模糊导致测试无法有效覆盖。场景三维护权威的“甩锅”行为。这在向上汇报时尤其明显。比如向老板或客户演示新产品原型现场突然死机。主管可能会立刻说“小张你是不是昨晚改的代码没经过测试就合入了” 在公开场合迅速指出一个具体下级的“错误”有时被管理者潜意识里视为展现自己洞察力和控制力的方式。即使事后查明是演示环境的外设兼容性问题或者根本就是主管自己之前决策采用的某个廉价芯片的稳定性缺陷那句当众的指责已经造成了伤害。2.2 “迁怒”如何系统性摧毁团队一次两次的迁怒或许会被理解为“领导脾气急”。但如果它成为一种团队文化或管理习惯其破坏力是系统性的。首先扼杀坦诚沟通与问题上报。团队成员会迅速学会“多一事不如少一事”。遇到潜在风险或小失误他们的第一反应不再是报告和求助而是掩盖和祈祷别在自己手上爆雷。因为上报问题等于引火烧身。在嵌入式开发中一个驱动里的警告warning没处理可能埋下重启的隐患。如果工程师曾因上报类似“小问题”而被斥为“能力不足”、“吹毛求疵”他下次就会选择沉默。最终小问题酿成大事故。其次导致责任体系的扭曲和失效。健康的责任体系是“对事负责”追溯问题根源完善流程。迁怒文化下的责任体系是“对人负责”重点是找到一个能承担骂名的个体。这会导致大家热衷于“划清界限”和“保留证据”而不是通力合作解决问题。在需要软硬件紧密协同的物联网项目里这种“各扫门前雪”的心态是致命的。最后损耗团队最宝贵的资产信任与士气。工程师尤其是优秀的工程师内心通常有极强的自尊和对专业的荣誉感。他们可以接受因自己技术判断失误而导致的批评但无法接受成为上级情绪或流程缺陷的替罪羊。一旦感到不公他们的选择往往是“离心”和“躺平”最直接的损失就是创造力和工作热情的熄灭。招聘和培养一个优秀的射频工程师或算法工程师成本极高而赶走他只需要几次不公正的迁怒就够了。注意识别迁怒不能只看管理者是否发了火。关键判别标准是批评指责的对象是否是导致问题的主要原因或唯一责任人如果批评指向了次要责任方或无辜者或者用对个人的指责替代了对系统性根因的剖析那就是迁怒。3. 如何做到“不迁怒”一套可操作的管理者行动指南知道了迁怒的危害那具体该怎么避免这绝不是一句“你要控制情绪”的鸡汤就能解决的。它需要管理者建立一套从思维习惯到行为模式的系统方法。结合我的经验可以分解为以下四个步骤。3.1 第一步按下“暂停键”建立问题响应缓冲期当坏消息传来无论是测试报告上一片红色还是客户打来投诉电话人的本能反应是应激的血液涌向大脑情绪主导思维。这个时候做出的判断和说出的话大概率是感性的、攻击性的。实操方法强制物理隔离与冷静程序。立即离开现场或沟通界面如果是当面汇报可以说“情况我了解了给我10分钟我们稍后在小会议室详细讨论。”如果是线上消息不要马上回复特别是不要在一连串的追问下仓促回复。起身去倒杯水去走廊走一圈。进行“三问”自检在冷静的几分钟里快速问自己三个问题第一问我的情绪现在是什么状态是愤怒、焦虑还是失望第二问这个情绪主要是由问题本身引发的还是由其他压力如老板施压、个人事务传导过来的第三问我即将要做出的反应比如批评某人目标是解决问题还是宣泄我当下的情绪转换问题陈述句式把“你怎么又搞砸了”这种指责性语言在脑子里转换成“我们遇到了一个XX问题目前的影响是YYY我们需要一起看看哪里出了岔子。” 把主语从“你”换成“我们”把“搞砸了”这种定性词换成对客观问题的描述。这个缓冲期是管理者从“情绪动物”回归“理性人”的关键。尤其在处理像芯片流片失败、重大安全漏洞这类高压事件时这十分钟的冷静可能价值千万。3.2 第二步开展“根因分析”而非“责任审判”情绪平稳后要立即启动对问题本身的调查。这里的核心是要把会议桌当成“手术台”而不是“法庭”。我们的目的是解剖问题找到病根而不是审判犯人。实操方法采用技术团队熟悉的“5Why分析法”或“鱼骨图”进行复盘。召集相关责任人注意是“相关责任人”而不是“疑似肇事者”开一个复盘会。会议基调必须是“今天不开批斗会只开复盘会。我们的唯一目标是搞清楚事情是怎么发生的以及如何防止再发生。”引导大家按照以下逻辑展开现象层发生了什么问题例如智能硬件设备在低温环境下概率性死机。技术层直接的技术原因是什么例如看门狗Watchdog电路在低温下触发复位的时间参数漂移。流程层为什么这个技术原因没有被发现例如硬件测试用例库中没有覆盖-20°C的低温看门狗专项测试项高低温测试报告评审时大家只关注了主要功能忽略了电源监控模块的细节。系统层为什么流程会缺失例如公司的硬件测试规范是从消费电子产品沿袭过来的对工业级或车规级应用的极端环境测试要求定义不完整项目周期紧张测试阶段被压缩一些“非典型”测试被裁减。文化层为什么系统允许这种情况发生例如公司文化更鼓励“快速上线、快速迭代”对“稳健可靠”的重视程度不足在资源分配上总是向新功能开发倾斜测试和质保资源长期紧张。通过这样一层层追问你会发现一个简单的“设备死机”最后可能指向测试规范、资源分配甚至公司战略导向的问题。那个硬件工程师可能只是在有缺陷的流程和紧张的资源下完成了他认为“正确”的工作。这时你还忍心把怒火全部倾泻到他一个人身上吗3.3 第三步明确责任归属但聚焦“改进”而非“惩罚”不迁怒不等于“和稀泥”不等于没有责任。责任必须清晰否则团队就会失去准绳。关键在于明确责任的目的是为了改进和预防而不是为了惩罚和羞辱。实操方法区分“执行责任”与“领导责任”公开承担。在根因分析清楚后责任通常会呈现一个谱系直接执行责任工程师A在编写某段驱动代码时未严格遵循代码规范留下了隐患。监督审核责任技术主管B在代码Review时没有发现这个隐患。流程保障责任项目经理C制定的开发计划过于激进挤占了必要的自测和Review时间。最终领导责任作为部门负责人的我默许了这种“重进度、轻质量”的氛围也没有为团队争取到更合理的资源。在复盘会上我应该首先公开承认自己的领导责任“这个问题的发生首要责任在我。我对于项目质量的重视只停留在口头上在资源紧张时首先妥协的往往是测试和评审时间这个导向是错误的。” 然后再依次厘清项目经理、技术主管和工程师的责任。对于工程师A批评应该是对事不对人的、建设性的“你这次在drv_sensor.c的第203行使用的延时函数没有考虑中断嵌套场景这违反了我们的编码安全准则第3条。这反映出你对这条准则的理解还不够深或者当时太匆忙了。接下来你需要和B主管一起重新学习这条准则并在下周的组会上分享一个正确的案例。同时你负责修正这个bug并补充相应的单元测试。”这样的处理责任清晰但指向是改进学习准则、修正bug、补充测试而非单纯的惩罚扣奖金、公开羞辱。当事人知道自己错在哪、如何改团队也看到了一个公正、有担当的处理方式。3.4 第四步推动闭环与改进将教训转化为团队资产复盘和追责的终点不是处分某个人而是要让团队和组织变得更强。必须形成一个闭环把这次事故的教训固化到流程、规范或检查表中避免“贰过”。实操方法生成“改进措施清单”并跟踪。复盘会议的最后必须产出一张明确的改进措施清单Action Items并指定负责人和完成时间。例如序号问题根因改进措施负责人完成时间状态1硬件测试规范缺少极端环境细分项修订《硬件测试用例设计规范》增加高低温、高低压等环境下对各电源监控、复位电路的专项测试要求。测试经理下月末进行中2代码Review流于形式未覆盖关键安全代码建立关键模块如驱动、中断处理的强制双人Review机制并制定Checklist。技术总监两周内待启动3项目计划未为质保活动留足时间修改项目计划模板强制要求将测试用例设计、评审、执行时间单独列出占比不低于总时间的30%。项目管理部下季度已规划4工程师对编码安全准则理解不深组织一次全部门的编码安全准则培训并安排一次考试。当事人A 主管B一个月内已安排这张表就是团队用一次错误换来的宝贵资产。管理者我的任务就是定期跟踪这些措施的落地情况。当下次类似项目启动时这些改进就应该已经生效从而从根本上降低同类问题发生的概率。这才是“不贰过”在组织层面的体现。4. 管理者自身的修养承认错误是力量的开始做到上面这些流程性的东西需要方法。但支撑这些方法能够被执行下去的是管理者内心的修养。其中最反人性、也最关键的一点就是公开承认自己的错误。我在文章开头提到的那个深圳大学论坛的例子就是一个深刻的教训。把PPT错别字归咎于秘书是几乎不假思索的本能反应。因为那能最快地维护自己“认真严谨”的形象。但孔子的话像一记耳光打醒了我你在讲“不迁怒”自己却在现场完美演绎了什么是“迁怒”。当我当众承认“主要责任在我”并为此向听众鞠躬时我担心的“权威扫地”并没有发生反而收获了掌声。那掌声让我明白团队成员和外界尊重一个管理者不是因为他永远正确而是因为他足够真实、足够担当。承认错误并不会削弱权威通过展现理性、负责和诚信管理者实际上在构建更坚实、基于尊重的权威。这对于技术出身的管理者尤其重要。我们习惯了用代码和电路说话对就是对错就是错。但在管理上这种“二进制思维”有时会让我们拉不下面子。我们会觉得“我是主管我承认错了以后还怎么管人” 事实恰恰相反。当你坦诚地说“上次关于架构选型的决策我判断有误给大家后续开发带来了麻烦我们接下来需要调整。” 团队听到的潜台词是“我的老板是讲道理的、是客观的、是可以沟通的。” 这种安全感会极大促进团队敢于提出不同意见敢于报告坏消息从而避免更大的决策失误。实操心得培养“认错”的习惯可以从一些小处开始。比如在周会上主动说“上周我催大家赶工语气急了方式不对给大家压力了抱歉。” 或者在一个技术讨论后说“刚才我坚持的那个方案经过大家的讨论确实不如小李提出的方案更优是我考虑不周按小李的方案执行。” 这些小动作会在团队中悄然播下“心理安全”的种子。5. 平衡的艺术不迁怒不等于做“老好人”讨论到这里必须警惕另一个极端为了避免“迁怒”的恶名管理者变得畏首畏尾不敢批评不敢问责当“老好人”。这是对“不迁怒”的严重误解。“不迁怒”的对面是“明赏罚”。一个健康的团队必须要有清晰的边界和标准。对于确实因玩忽职守、重复低级错误、违背职业道德而造成的损失必须进行严厉、公正的处罚。关键在于区分“能力问题”、“流程问题”和“态度问题”。能力问题员工很努力但因知识、经验所限未能做好。处理方式培训、辅导、调整岗位或任务。管理者应承担“培养不力”的责任。流程问题员工按既有流程操作但流程本身有缺陷导致问题。处理方式优化流程不处罚员工。管理者应承担“流程设计/维护不力”的责任。态度问题员工有能力和条件做好却因懈怠、马虎、违背明确指令而犯错。处理方式批评教育依规处罚。这是员工应承担的主要责任。例如一个嵌入式软件工程师因为对实时操作系统RTOS的优先级反转机制理解不深设计了一个有潜在死锁风险的任务通信模块这属于能力问题。应该安排资深工程师对他进行培训并加强代码审查。但如果公司明明有严格的《代码提交规范》要求所有提交必须附带测试用例他为了图方便多次绕过规范直接提交最终引发集成测试失败这就是态度问题。对此必须提出严肃批评并依据制度给予相应处理。所以“不迁怒”的真谛是追求公正而不是追求仁慈。它要求管理者像一位严谨的工程师调试电路一样精准地定位问题的根源是元器件参数不对、是电路设计有误、还是外部干扰太大然后针对性地采取措施更换元件、修改设计、增加屏蔽而不是简单地用锤子砸一遍电路板了事。6. 构建“不迁怒”的团队文化从管理者到整个系统个人的修养和单次事件的处理是基础。但要真正让“不迁怒”成为团队基因需要上升到文化层面进行系统建设。首先管理者要成为文化的“活样板”。言传身教永远是最有力的。当你每一次都能在问题面前保持冷静、主持公道、主动担责你的团队就会慢慢相信这里真的是一个“对事不对人”的环境。他们会开始模仿这种处理问题的方式。其次建立“无责备复盘”Blameless Postmortem机制。在重大技术故障如线上事故、重大质量缺陷处理后强制推行“无责备复盘会”。会议的核心规则就是在复盘期间禁止任何针对个人的指责只关注事实、时间线和系统原因。鼓励所有人无论层级高低畅所欲言。会议产出不是追责名单而是前面提到的“改进措施清单”。谷歌、亚马逊等公司在这方面有非常成熟的实践可以借鉴。再次在绩效考核中纳入“协作”与“担当”维度。除了考核个人业绩如完成了多少功能、解决了多少bug还要考核他在团队协作中的表现。例如是否主动分享知识是否在同事遇到困难时提供帮助是否敢于在项目中提出风险和问题是否在出现失误时能坦诚面对并积极补救通过绩效这个指挥棒引导大家关注集体成功和系统优化。最后保护那些“报忧”的人。要公开表扬和奖励那些主动报告问题、揭露隐患的员工即使他们报告的问题是他们自己造成的。树立“发现问题就是贡献”的价值观。可以设立“最佳啄木鸟奖”、“风险预警奖”等让团队看到说真话、报实情不仅不会受罚还会受到鼓励。管理归根结底是“管人理事”。技术会迭代产品会更新但一个团队面对压力、面对错误时的反应模式决定了它能走多远。“不迁怒”这三个字像一颗定盘星稳住的是管理者的心照见的是问题的本相最终凝聚起的是一个有信任、有担当、能打硬仗的团队。它或许不能让你立刻解决一个技术难题但它能保证当难题出现时你身边是一群愿意和你一起冷静分析、共同担当的伙伴而不是一群时刻准备着躲避枪口的惊弓之鸟。这才是管理者最核心的修为也是最宝贵的财富。