YOLO系列输入处理与数据工程 Mosaic v9 与 MixUp 的组合增强策略 YOLO系列输入处理与数据工程 Mosaic v9 与 MixUp 的组合增强策略原创专栏 · YOLO技术点100讲开场:一张图里塞九张图,图什么?想象你正在训练一个安检系统,让它识别行李箱里的违禁品。你的训练图库里,大多数照片只拍到了一两个物品,背景是空荡荡的传送带。模型学得很开心——直到部署时,它面对了一张塞满行李、人群拥挤、光线杂乱的真实场景,直接懵了。这就是上下文饥饿(Context Starvation)。模型见过太少的目标组合,没见过目标之间的遮挡关系,更没见过小目标淹没在复杂背景里的样子。别急,YOLO系列解决这个问题的核心武器,就是Mosaic——把多张图暴力拼接成一张。从YOLOv4的4图拼接,到YOLOv8的9图拼接(Mosaic9),再到与MixUp的线性混合,形成了一套**"先拼后混"的组合拳**。今天我们不泛泛而谈,直接拆解这套组合拳的每一个动作:什么时候出拳、力度多大、最后几回合为什么收力。第一步:宏观——Mosaic 的三代进化地图如果画成图会是什么样子?想象一条横向展开的生产线,从4图拼接到9图拼接,再到全尺度保留。