一、 膨胀的原理数学表达式dst(x,y) dilate(src(x,y)) max(x,y)src(xx,yy)膨胀是图像形态学的基本功能之一膨胀顾名思义就是求图像的局部最大值操作它的数学表达式是dst(x,y) dilate(src(x,y)) max(x,y)src(xx,yy)。若从数学的角度来看无论是膨胀还是腐蚀实际上就是把图像跟核进行卷积(卷积是通过两个函数f和g生成第三个函数的一种数学运算它的本质就是微积分的转换积分转换的数学公式(f * g)(t) ∫f(τ)g(t -τ)dτ)如上图1图像A和形状B进行卷积操作然后形成右边的图像右边的图像就是AB的图像点。所谓的核就是指任意的形状或者大小在多数情况下核是一个小的中间带的正方形或者圆形。膨胀本质上就是把图像与核进行卷积操作然后计算出卷积区域的最大点并把最大的值赋值给指定的像素(如上图)。操作完成之后图像就会更加明亮(如下图)。上图就是膨胀前和膨胀后图像的对比。从这张图我们可以看出来右边经过dilate膨胀操作后整个图像更加的明亮和粗糙。二、膨胀的API讲解2.1.dilate的API在OPENCV中有一个专门的API去处理图像的膨胀这个API就是dilatevoid dilate( InputArray src, OutputArray dst, InputArray kernel, Point anchor Point(-1, -1), int iterations 1, int borderType BORDER_CONSTANT, const Scalar borderValue morphologyDefaultBorderValue() );第一个参数src的类型是InputArray它指的是输入图像它可以是Mat类的数据。图像的通道数可以是任意数但是图像的深度一般是CV_8UCV_16UCV_16SCV_32FCV_64F第二个参数dst的类型是OutputArray它指的是目标图像值得注意的是输出图像的尺寸、类型要和输入图像是一致的。第三个参数InputArray类型的kernel膨胀操作的核。当这个值为NULL的时候表示使用的核参考点默认是3*3。这个参数通常会配合getStructingElement参数的使用(这个参数的使用下面会详细说到)。第四个参数Point类型的anchor描点的位置默认是(-1,-1)表示中心位置。第五个参数int类型的迭代次数默认是1意思是连续执行几次膨胀1向外扩 1 圈最常用轻微补缺口、消锯齿2向外扩 2 圈效果更强能填更大的洞、接更远的断裂次数越多目标形状失真越严重工程上一般不超过 3 次小技巧2 次 3×3 膨胀 ≈ 1 次 5×5 膨胀效果接近计算量略有差异第六个参数int类型的borderType这个类型用于推断图像外部的边界模式用的最多的是BORDER_DEFAULT下面是常用的几种边框模式(这几种相对比较常用其他的用的很少)BORDER_CONSTANT用指定的像素填充边框BORDER_REPLICATE用已知的边缘像素来填充边框BORDER_WRAP用另一边的像素来补偿填充BORDER_DEFAULT默认模式画边框BORDER_TRANSPANT:用透明的方式画框第七个参数const Scalar类型的borderType一般不用填写因为这个API已经有了默认值morphologyDefaultBorderValue()2.2.getStructingElement的API该函数的作用是返回一个卷积层Mat getStructuringElement( int shape, Size ksize, Point anchor Point(-1, -1) );第一个参数表示内核的形状这里包括了矩形(MORPH_RECT)、交叉形(MORPH_CROSS)、椭圆形(MORPH_ELLIPSE)常用的内核形状是矩形枚举值形状适用场景MORPH_RECT矩形核最通用方方正正膨胀适合方形、规则目标计算最快嵌入式优先选MORPH_ELLIPSE椭圆形核膨胀后边缘更圆润平滑适合圆形、文字、不规则目标效果更自然MORPH_CROSS十字形核只在横竖方向膨胀适合横竖线条类目标第二个参数内核的尺寸格式Size(宽, 高)一般宽高相等且为奇数保证有中心点常用规格Size(3,3)轻微膨胀补小缺口、消锯齿对目标尺寸影响极小90% 场景首选Size(5,5)中等强度膨胀填小孔、接断裂目标会明显变粗更大的核7×7 以上强膨胀会严重改变目标形状非特殊需求不建议用生成核的标准写法// 最常用3×3矩形核通用、速度快 Mat kernel getStructuringElement(MORPH_RECT, Size(3, 3)); // 圆润效果3×3椭圆核适合文字、圆形 Mat kernel_ellipse getStructuringElement(MORPH_ELLIPSE, Size(3, 3));第三个参数锚点的位置默认值Point(-1,-1)表示的是位于中心点三、代码实现图像膨胀功能3.1.用OPENCV实现膨胀功能的大体流程图从上面的流程图我们可以看出来OPENCV实现膨胀功能需要有以下几步分别是imread读取图片、使用cvtColor对图片进行灰度操作、使用getStructingElement获取卷积层、使用dilate对图片进行膨胀、imwrite保存图片3.2.代码#include opencv2/opencv.hpp #include opencv2/dnn.hpp #include opencv2/imgcodecs.hpp #include opencv2/imgproc.hpp #include iostream using namespace cv; using namespace std; int main() { Mat testImage imread(drink.png); if(testImage.empty()) { printf(read testImage failed....\n); return -1; } Mat vertical_structure getStructuringElement(MORPH_RECT, Size(15,15)); dilate(testImage, testImage, vertical_structure); imwrite(dilate_process.jpg, testImage); return 0; }1.读取我们需要处理的图片Mat testImage imread(drink.png); if(testImage.empty()) { printf(read testImage failed....\n); }使用imread读取我们需要处理的图片2.获取卷积层Mat vertical_structure getStructuringElement(MORPH_RECT, Size(15,15));使用getStructuringElement获取卷积层参数设置内核的形状是MORPH_RECT、内核的长度是Size(15,15)3. dilate对图片进行膨胀操作dilate(testImage, testImage, vertical_structure);获取完卷积层后我们就对图片进行dilate膨胀关于dilate的API上面已经详细说到了。最后用imwrite保存图片经过上述处理过后我们来看看原图和处理后的图片效果左边是原图右边是经过膨胀后的图片。我们可以看到右边经过膨胀的图片明显更加明亮和粗糙这是因为dilate就是把原图和卷积层进行重叠整个图像的像素都会变大。四、腐蚀的原理数学表达式dst(x,y) erode(src(x,y)) min(x,y)src(xx,yy)腐蚀也是图像形态学的基本功能之一腐蚀跟膨胀属于反向操作膨胀是把图像图像变大而腐蚀就是把图像变小。腐蚀的原理就是指定一个卷积内核然后原图像和卷积内核进行局部最小值的计算最终获取到一个局部像素点最小的图像如上图1数学表达式是dst(x,y) erode(src(x,y)) min(x,y)src(xx,yy)。经过erode处理后我们来看看两个图片的区别看下图左边是原图右边是经过腐蚀过后的图像。我们可以明显看出来右边的图像字母部分明显比左边的原图像更加细小但是黑暗背景部分会更加大。五、腐蚀的API讲解5.1 erode的函数定义erode是OPENCV实现腐蚀效果的APIvoid erode( InputArray src, OutputArray dst, InputArray kernel, Point anchor Point(-1, -1), int iterations 1, int borderType BORDER_CONSTANT, const Scalar borderValue morphologyDefaultBorderValue() );第一个参数src的类型是InputArray它指的是输入图像它可以是Mat类的数据。图像的通道数可以是任意数但是图像的深度一般是CV_8UCV_16UCV_16SCV_32FCV_64F第二个参数dst的类型是OutputArray它指的是目标图像值得注意的是输出图像的尺寸、类型要和输入图像是一致的。第三个参数InputArray类型的kernel膨胀操作的核。当这个值为NULL的时候表示使用的核参考点默认是3*3。这个参数通常会配合getStructingElement参数的使用(这个参数的使用下面我会详细说到)。第四个参数Point类型的anchor描点的位置默认是(-1,-1)表示中心位置。第五个参数int类型的迭代次数默认是1第六个参数int类型的borderType这个类型用于推断图像外部的边界模式它的默认值是BORDER_DEFAULT第七个参数const Scalar类型的borderType一般不用填写因为这个API已经有了默认值morphologyDefaultBorderValue()5.2 getStructingElement的函数定义getStructingElement的作用是返回一个卷积层CV_EXPORTS_W Mat getStructuringElement(int shape, Size ksize, Point anchor Point(-1,-1));第一个参数表示内核的形状这里包括了矩形(MORPH_RECT)、交叉形(MORPH_CROSS)、椭圆形(MORPH_ELLIPSE)第二个参数内核的尺寸第三个参数锚点的位置默认值Point(-1,-1)表示的是位于中心点六、OPENCV代码实现图像腐蚀功能6.1用OPENCV实现腐蚀功能的大体流程图从上面的流程图我们可以看出来OPENCV实现膨胀功能需要有以下几步分别是imread读取图片、使用getStructingElement获取卷积层、使用erode对图片进行腐蚀、imwrite保存腐蚀后的图片6.2代码#include opencv2/imgcodecs.hpp #include opencv2/highgui.hpp #include opencv2/imgproc.hpp #include iostream using namespace cv; using namespace std; int main() { Mat testImage imread(drink.png); if(testImage.empty()) { printf(could not load image.....\n); return -1; } Mat vertical_structure getStructuringElement(MORPH_RECT, Size(15,15)); erode(testImage, testImage, vertical_structure); imwrite(erode_process.jpg, testImage); return 0; }1.读取我们需要处理的图片Mat testImage imread(drink.png); if(testImage.empty()) { printf(could not load image.....\n); return -1; }使用imread读取我们需要处理的图片2. 获取卷积层Mat vertical_structure getStructuringElement(MORPH_RECT, Size(15,15));使用getStructuringElement获取卷积层参数设置内核的形状是MORPH_RECT、内核的长度是Size(15,15)3. erode对图片进行腐蚀操作erode(testImage, testImage, vertical_structure);获取完卷积层后我们就对图片进行erode腐蚀关于erode的API上面已经详细说到了最后调用imwrite保存图片(这里就省略不写出来)。经过上面处理后我们来看看处理后的图片左边是原图右边是经过腐蚀后的图片。我们可以看到右边经过腐蚀的图片饮料部分图片变小了而整个背景则加深了。
OPENCV——形态学基础之膨胀、腐蚀
发布时间:2026/6/30 23:01:15
一、 膨胀的原理数学表达式dst(x,y) dilate(src(x,y)) max(x,y)src(xx,yy)膨胀是图像形态学的基本功能之一膨胀顾名思义就是求图像的局部最大值操作它的数学表达式是dst(x,y) dilate(src(x,y)) max(x,y)src(xx,yy)。若从数学的角度来看无论是膨胀还是腐蚀实际上就是把图像跟核进行卷积(卷积是通过两个函数f和g生成第三个函数的一种数学运算它的本质就是微积分的转换积分转换的数学公式(f * g)(t) ∫f(τ)g(t -τ)dτ)如上图1图像A和形状B进行卷积操作然后形成右边的图像右边的图像就是AB的图像点。所谓的核就是指任意的形状或者大小在多数情况下核是一个小的中间带的正方形或者圆形。膨胀本质上就是把图像与核进行卷积操作然后计算出卷积区域的最大点并把最大的值赋值给指定的像素(如上图)。操作完成之后图像就会更加明亮(如下图)。上图就是膨胀前和膨胀后图像的对比。从这张图我们可以看出来右边经过dilate膨胀操作后整个图像更加的明亮和粗糙。二、膨胀的API讲解2.1.dilate的API在OPENCV中有一个专门的API去处理图像的膨胀这个API就是dilatevoid dilate( InputArray src, OutputArray dst, InputArray kernel, Point anchor Point(-1, -1), int iterations 1, int borderType BORDER_CONSTANT, const Scalar borderValue morphologyDefaultBorderValue() );第一个参数src的类型是InputArray它指的是输入图像它可以是Mat类的数据。图像的通道数可以是任意数但是图像的深度一般是CV_8UCV_16UCV_16SCV_32FCV_64F第二个参数dst的类型是OutputArray它指的是目标图像值得注意的是输出图像的尺寸、类型要和输入图像是一致的。第三个参数InputArray类型的kernel膨胀操作的核。当这个值为NULL的时候表示使用的核参考点默认是3*3。这个参数通常会配合getStructingElement参数的使用(这个参数的使用下面会详细说到)。第四个参数Point类型的anchor描点的位置默认是(-1,-1)表示中心位置。第五个参数int类型的迭代次数默认是1意思是连续执行几次膨胀1向外扩 1 圈最常用轻微补缺口、消锯齿2向外扩 2 圈效果更强能填更大的洞、接更远的断裂次数越多目标形状失真越严重工程上一般不超过 3 次小技巧2 次 3×3 膨胀 ≈ 1 次 5×5 膨胀效果接近计算量略有差异第六个参数int类型的borderType这个类型用于推断图像外部的边界模式用的最多的是BORDER_DEFAULT下面是常用的几种边框模式(这几种相对比较常用其他的用的很少)BORDER_CONSTANT用指定的像素填充边框BORDER_REPLICATE用已知的边缘像素来填充边框BORDER_WRAP用另一边的像素来补偿填充BORDER_DEFAULT默认模式画边框BORDER_TRANSPANT:用透明的方式画框第七个参数const Scalar类型的borderType一般不用填写因为这个API已经有了默认值morphologyDefaultBorderValue()2.2.getStructingElement的API该函数的作用是返回一个卷积层Mat getStructuringElement( int shape, Size ksize, Point anchor Point(-1, -1) );第一个参数表示内核的形状这里包括了矩形(MORPH_RECT)、交叉形(MORPH_CROSS)、椭圆形(MORPH_ELLIPSE)常用的内核形状是矩形枚举值形状适用场景MORPH_RECT矩形核最通用方方正正膨胀适合方形、规则目标计算最快嵌入式优先选MORPH_ELLIPSE椭圆形核膨胀后边缘更圆润平滑适合圆形、文字、不规则目标效果更自然MORPH_CROSS十字形核只在横竖方向膨胀适合横竖线条类目标第二个参数内核的尺寸格式Size(宽, 高)一般宽高相等且为奇数保证有中心点常用规格Size(3,3)轻微膨胀补小缺口、消锯齿对目标尺寸影响极小90% 场景首选Size(5,5)中等强度膨胀填小孔、接断裂目标会明显变粗更大的核7×7 以上强膨胀会严重改变目标形状非特殊需求不建议用生成核的标准写法// 最常用3×3矩形核通用、速度快 Mat kernel getStructuringElement(MORPH_RECT, Size(3, 3)); // 圆润效果3×3椭圆核适合文字、圆形 Mat kernel_ellipse getStructuringElement(MORPH_ELLIPSE, Size(3, 3));第三个参数锚点的位置默认值Point(-1,-1)表示的是位于中心点三、代码实现图像膨胀功能3.1.用OPENCV实现膨胀功能的大体流程图从上面的流程图我们可以看出来OPENCV实现膨胀功能需要有以下几步分别是imread读取图片、使用cvtColor对图片进行灰度操作、使用getStructingElement获取卷积层、使用dilate对图片进行膨胀、imwrite保存图片3.2.代码#include opencv2/opencv.hpp #include opencv2/dnn.hpp #include opencv2/imgcodecs.hpp #include opencv2/imgproc.hpp #include iostream using namespace cv; using namespace std; int main() { Mat testImage imread(drink.png); if(testImage.empty()) { printf(read testImage failed....\n); return -1; } Mat vertical_structure getStructuringElement(MORPH_RECT, Size(15,15)); dilate(testImage, testImage, vertical_structure); imwrite(dilate_process.jpg, testImage); return 0; }1.读取我们需要处理的图片Mat testImage imread(drink.png); if(testImage.empty()) { printf(read testImage failed....\n); }使用imread读取我们需要处理的图片2.获取卷积层Mat vertical_structure getStructuringElement(MORPH_RECT, Size(15,15));使用getStructuringElement获取卷积层参数设置内核的形状是MORPH_RECT、内核的长度是Size(15,15)3. dilate对图片进行膨胀操作dilate(testImage, testImage, vertical_structure);获取完卷积层后我们就对图片进行dilate膨胀关于dilate的API上面已经详细说到了。最后用imwrite保存图片经过上述处理过后我们来看看原图和处理后的图片效果左边是原图右边是经过膨胀后的图片。我们可以看到右边经过膨胀的图片明显更加明亮和粗糙这是因为dilate就是把原图和卷积层进行重叠整个图像的像素都会变大。四、腐蚀的原理数学表达式dst(x,y) erode(src(x,y)) min(x,y)src(xx,yy)腐蚀也是图像形态学的基本功能之一腐蚀跟膨胀属于反向操作膨胀是把图像图像变大而腐蚀就是把图像变小。腐蚀的原理就是指定一个卷积内核然后原图像和卷积内核进行局部最小值的计算最终获取到一个局部像素点最小的图像如上图1数学表达式是dst(x,y) erode(src(x,y)) min(x,y)src(xx,yy)。经过erode处理后我们来看看两个图片的区别看下图左边是原图右边是经过腐蚀过后的图像。我们可以明显看出来右边的图像字母部分明显比左边的原图像更加细小但是黑暗背景部分会更加大。五、腐蚀的API讲解5.1 erode的函数定义erode是OPENCV实现腐蚀效果的APIvoid erode( InputArray src, OutputArray dst, InputArray kernel, Point anchor Point(-1, -1), int iterations 1, int borderType BORDER_CONSTANT, const Scalar borderValue morphologyDefaultBorderValue() );第一个参数src的类型是InputArray它指的是输入图像它可以是Mat类的数据。图像的通道数可以是任意数但是图像的深度一般是CV_8UCV_16UCV_16SCV_32FCV_64F第二个参数dst的类型是OutputArray它指的是目标图像值得注意的是输出图像的尺寸、类型要和输入图像是一致的。第三个参数InputArray类型的kernel膨胀操作的核。当这个值为NULL的时候表示使用的核参考点默认是3*3。这个参数通常会配合getStructingElement参数的使用(这个参数的使用下面我会详细说到)。第四个参数Point类型的anchor描点的位置默认是(-1,-1)表示中心位置。第五个参数int类型的迭代次数默认是1第六个参数int类型的borderType这个类型用于推断图像外部的边界模式它的默认值是BORDER_DEFAULT第七个参数const Scalar类型的borderType一般不用填写因为这个API已经有了默认值morphologyDefaultBorderValue()5.2 getStructingElement的函数定义getStructingElement的作用是返回一个卷积层CV_EXPORTS_W Mat getStructuringElement(int shape, Size ksize, Point anchor Point(-1,-1));第一个参数表示内核的形状这里包括了矩形(MORPH_RECT)、交叉形(MORPH_CROSS)、椭圆形(MORPH_ELLIPSE)第二个参数内核的尺寸第三个参数锚点的位置默认值Point(-1,-1)表示的是位于中心点六、OPENCV代码实现图像腐蚀功能6.1用OPENCV实现腐蚀功能的大体流程图从上面的流程图我们可以看出来OPENCV实现膨胀功能需要有以下几步分别是imread读取图片、使用getStructingElement获取卷积层、使用erode对图片进行腐蚀、imwrite保存腐蚀后的图片6.2代码#include opencv2/imgcodecs.hpp #include opencv2/highgui.hpp #include opencv2/imgproc.hpp #include iostream using namespace cv; using namespace std; int main() { Mat testImage imread(drink.png); if(testImage.empty()) { printf(could not load image.....\n); return -1; } Mat vertical_structure getStructuringElement(MORPH_RECT, Size(15,15)); erode(testImage, testImage, vertical_structure); imwrite(erode_process.jpg, testImage); return 0; }1.读取我们需要处理的图片Mat testImage imread(drink.png); if(testImage.empty()) { printf(could not load image.....\n); return -1; }使用imread读取我们需要处理的图片2. 获取卷积层Mat vertical_structure getStructuringElement(MORPH_RECT, Size(15,15));使用getStructuringElement获取卷积层参数设置内核的形状是MORPH_RECT、内核的长度是Size(15,15)3. erode对图片进行腐蚀操作erode(testImage, testImage, vertical_structure);获取完卷积层后我们就对图片进行erode腐蚀关于erode的API上面已经详细说到了最后调用imwrite保存图片(这里就省略不写出来)。经过上面处理后我们来看看处理后的图片左边是原图右边是经过腐蚀后的图片。我们可以看到右边经过腐蚀的图片饮料部分图片变小了而整个背景则加深了。