在图像识别和纹理分析领域矩是一种强大的工具它可以把图像的形状或纹理这种直观的视觉信息浓缩成一组定量的数字特征。就像用几个关键数字身高、体重、年龄来概括一个人矩就是用数字来概括一个图像区域的统计形态。我们之前聊CNN卷积神经网络的卷积核能自动学习特征而矩特别是四阶矩是一种经典的、基于统计学的手工设计特征。在工业检测、医学图像分析等场景当标记数据不足支撑训练一个CNN时矩特征结合传统机器学习模型依然是很可靠的选择。要理解四阶矩需要先明白阶数Order是什么意思。0阶矩质量。就是图像像素值的总和代表“总亮度”。1阶矩重心/质心。代表图像亮度的“中心点”在哪里。2阶矩方差即分布的“胖瘦”或“朝向”。代表像素值相对于质心的散布程度和方向。3阶矩偏度即分布的“歪不歪”。代表分布相对于中心的不对称性。如果分布右边尾巴长、左边尾巴短偏度就为正。4阶矩峰度即分布的“峰有多尖尾有多肥”。这是我们今天的焦点。一、四阶矩峰度的直观理解峰度一言以蔽之衡量的是数据分布的陡峭或平缓程度尤其关注分布的尾部厚度。可以把它想象成在对比两座山高峰度尖峰厚尾一座很尖的山但它的山脚却异常宽阔。对应图像的像素值分布就是大多数像素集中在平均值附近山峰尖但同时又有一些极亮或极暗的像素散落在很远处山脚厚即厚尾。这意味着图像对比度强有显著的亮点或暗点。低峰度平峰瘦尾一座平缓的山丘山脚也很窄。对应图像就是像素值分布很均匀没有特别集中也没有特别极端的值整体纹理看起来柔和、均匀。数学本质简约版四阶中心矩的计算是每个像素值与均值的差值的4次方求平均再除以标准差的4次方然后用这个结果减去3这叫超值峰度减3是为了让正态分布的超值峰度为0作为基准。超值峰度 0高峰度比正态分布更尖尾巴更厚。超值峰度 0类似正态分布的尖峭程度。超值峰度 0低峰度比正态分布更平尾巴更薄。二、图像识别中的物理意义在图像处理里我们通常计算的是图像灰度直方图的四阶矩。它的物理意义非常直观1. 纹理的“锐利度”或“颗粒感”高峰度图像纹理要么非常平滑大部分像素集中在均值要么突然冒出几个尖锐的噪点或强反光点。这像是撒了零星闪光粉的黑布。低峰度图像纹理非常均匀、柔和没有明显的极端亮暗点。像是一块用了很久、磨损均匀的帆布。2. 缺陷检测的利器这是四阶矩在工业界最有价值的应用。想象一块光滑的金属表面无缺陷表面平滑像素灰度都很接近均值但因为没有极端的亮点或暗点它的峰度可能表现为较低或接近正态特征非常稳定。出现划痕或脏点突然出现了非常暗划痕或非常亮脏点反光的像素。这使得分布的尾部瞬间变厚峰度值会急剧飙升。因此通过监控图像四阶矩的变化就可以极其灵敏地捕捉到哪怕面积很小、但对比度高的局部缺陷而不用关心缺陷的具体形状。三、与其他矩的协同作战单靠一个四阶矩无法描述所有特征。一个经典的纹理特征描述范式是联合使用二阶、三阶、四阶矩。想象你在描述一个图像亮度直方图的形状一维波形你至少需要说清宽度2阶方差整体对比度跨度大不大。歪斜3阶偏度整体是偏亮波峰在左边还是偏暗波峰在右边。尖峭度与尾部4阶峰度质地是均匀还是带有极端的斑点。这三个统计量一组合就构成了对图像纹理非常强健的描述它们共同组成了一种简单但有效的手工特征向量。四、全局vs局部高阶矩的两种用法全局四阶矩对整个图像区域算一个峰度值。简单粗暴适合判断整张图“是否有异常”速度快。局部四阶矩用一个滑动小窗口比如16x16像素扫过图像每个窗口计算一个峰度值最终生成一张“峰度特征图”。这能精确定位纹理不均或缺陷的位置还可以直接送入后续的机器学习分类器。五、总结框图
机器学习篇---四阶特征矩
发布时间:2026/5/20 1:42:21
在图像识别和纹理分析领域矩是一种强大的工具它可以把图像的形状或纹理这种直观的视觉信息浓缩成一组定量的数字特征。就像用几个关键数字身高、体重、年龄来概括一个人矩就是用数字来概括一个图像区域的统计形态。我们之前聊CNN卷积神经网络的卷积核能自动学习特征而矩特别是四阶矩是一种经典的、基于统计学的手工设计特征。在工业检测、医学图像分析等场景当标记数据不足支撑训练一个CNN时矩特征结合传统机器学习模型依然是很可靠的选择。要理解四阶矩需要先明白阶数Order是什么意思。0阶矩质量。就是图像像素值的总和代表“总亮度”。1阶矩重心/质心。代表图像亮度的“中心点”在哪里。2阶矩方差即分布的“胖瘦”或“朝向”。代表像素值相对于质心的散布程度和方向。3阶矩偏度即分布的“歪不歪”。代表分布相对于中心的不对称性。如果分布右边尾巴长、左边尾巴短偏度就为正。4阶矩峰度即分布的“峰有多尖尾有多肥”。这是我们今天的焦点。一、四阶矩峰度的直观理解峰度一言以蔽之衡量的是数据分布的陡峭或平缓程度尤其关注分布的尾部厚度。可以把它想象成在对比两座山高峰度尖峰厚尾一座很尖的山但它的山脚却异常宽阔。对应图像的像素值分布就是大多数像素集中在平均值附近山峰尖但同时又有一些极亮或极暗的像素散落在很远处山脚厚即厚尾。这意味着图像对比度强有显著的亮点或暗点。低峰度平峰瘦尾一座平缓的山丘山脚也很窄。对应图像就是像素值分布很均匀没有特别集中也没有特别极端的值整体纹理看起来柔和、均匀。数学本质简约版四阶中心矩的计算是每个像素值与均值的差值的4次方求平均再除以标准差的4次方然后用这个结果减去3这叫超值峰度减3是为了让正态分布的超值峰度为0作为基准。超值峰度 0高峰度比正态分布更尖尾巴更厚。超值峰度 0类似正态分布的尖峭程度。超值峰度 0低峰度比正态分布更平尾巴更薄。二、图像识别中的物理意义在图像处理里我们通常计算的是图像灰度直方图的四阶矩。它的物理意义非常直观1. 纹理的“锐利度”或“颗粒感”高峰度图像纹理要么非常平滑大部分像素集中在均值要么突然冒出几个尖锐的噪点或强反光点。这像是撒了零星闪光粉的黑布。低峰度图像纹理非常均匀、柔和没有明显的极端亮暗点。像是一块用了很久、磨损均匀的帆布。2. 缺陷检测的利器这是四阶矩在工业界最有价值的应用。想象一块光滑的金属表面无缺陷表面平滑像素灰度都很接近均值但因为没有极端的亮点或暗点它的峰度可能表现为较低或接近正态特征非常稳定。出现划痕或脏点突然出现了非常暗划痕或非常亮脏点反光的像素。这使得分布的尾部瞬间变厚峰度值会急剧飙升。因此通过监控图像四阶矩的变化就可以极其灵敏地捕捉到哪怕面积很小、但对比度高的局部缺陷而不用关心缺陷的具体形状。三、与其他矩的协同作战单靠一个四阶矩无法描述所有特征。一个经典的纹理特征描述范式是联合使用二阶、三阶、四阶矩。想象你在描述一个图像亮度直方图的形状一维波形你至少需要说清宽度2阶方差整体对比度跨度大不大。歪斜3阶偏度整体是偏亮波峰在左边还是偏暗波峰在右边。尖峭度与尾部4阶峰度质地是均匀还是带有极端的斑点。这三个统计量一组合就构成了对图像纹理非常强健的描述它们共同组成了一种简单但有效的手工特征向量。四、全局vs局部高阶矩的两种用法全局四阶矩对整个图像区域算一个峰度值。简单粗暴适合判断整张图“是否有异常”速度快。局部四阶矩用一个滑动小窗口比如16x16像素扫过图像每个窗口计算一个峰度值最终生成一张“峰度特征图”。这能精确定位纹理不均或缺陷的位置还可以直接送入后续的机器学习分类器。五、总结框图