097、多模型级联策略:YOLO 粗检 + 高精度模型细分的两级漏斗方案 097、多模型级联策略:YOLO 粗检 + 高精度模型细分的两级漏斗方案一、从一次线上事故说起去年做工业质检项目,客户要求检测PCB板上的微小焊点缺陷。YOLOv8s跑下来,mAP有0.87,看着还行。结果一上线,漏检率直接飙到15%。排查发现,问题出在那些只有几十个像素的虚焊点上——YOLO的anchor设计天生对大目标友好,小目标特征在深层几乎被抹平了。更头疼的是,客户还要求区分“虚焊”“连焊”“冷焊”三种类型。YOLO虽然能框出来,但分类置信度经常在0.4-0.6之间晃荡,根本没法用。当时团队里有人提议换两阶段检测器,但推理速度从30fps掉到8fps,产线直接不干了。后来我翻出之前做遥感图像时的老思路:用YOLO做第一道筛子,把候选区域抠出来,再扔给一个专门做细分类的小模型。这个方案上线后,漏检率降到2%,分类准确率从72%提到94%,推理速度只降了5fps。今天就把这套“粗检+细分”的两级漏斗方案拆开揉碎了讲。二、为什么单模型搞不定?——特征冲突的本质先别急着写代码,想清楚一个问题:为什么YOLO在检测和细分类上会打架?YOLO的head设计是“共享特征+独立分支”。同一个backbone出来的特征图,既要回归bbox,又要预测类别。当类别数少(比如只有“缺陷”和“正常”)时,特征还能兼顾。但一旦类别细到“虚焊vs冷焊”,这两个类别的视觉差异可能比“虚焊vs正常”还小——backbone被迫在同一个特征空间里同时区分“有没有”和