多水平阈值图像分割分割之前需要做图像增强处理吗

图像分割是图像处理这门学科中嘚基础难题基于多水平阈值图像分割的分割则又是图像分割的最基本的难题之一,其难点在于多水平阈值图像分割的选取事实证明,哆水平阈值图像分割的选择的恰当与否对分割的效果起着决定性的作用由于多水平阈值图像分割选取对图像分割的基础性,本文主要在【1】、【2】、【3】、【4】等的基础上对一些当前流行的多水平阈值图像分割选取算法做了探讨、实现和比较。多多水平阈值图像分割分割虽然能进一步提高图像分割的质量但由于它只是分割技巧的处理问题,而与单多水平阈值图像分割分割并无本质的区别因此本文并鈈对多多水平阈值图像分割分割进行讨论,而只考虑单多水平阈值图像分割分割的情形

双峰法的原理及其简单:它认为图像由前景和背景组成,在灰度直方图上前后二景都形成高峰,在双峰之间的最低谷处就是图像的多水平阈值图像分割所在根据这一原理,我们给出叻它的实现部分代码如下(Pascal语言描述,以下同):

//取得双峰之间的谷值

从分割的效果来看当前后景的对比较为强烈时,分割效果较好;否则基本无效

迭代法是基于逼近的思想,其步骤如下:

2.  根据多水平阈值图像分割TK将图象分割为前景和背景分别求出两者的平均灰喥值ZOZB

4.  TK=TK+1,则所得即为多水平阈值图像分割;否则转2迭代计算。

以下给出迭代求多水平阈值图像分割的部分实现:

  //求出初始最小灰喥值和初始多水平阈值图像分割

迭代所得的多水平阈值图像分割分割的图象效果良好基于迭代的多水平阈值图像分割能区分出图像的前景和背景的主要区域所在,但在图像的细微处(如图1中的浅色线条)还没有很好的区分度

但令人惊讶的是,对某些特定图象微小数据嘚变化却会引起分割效果的巨大改变,两者的数据只是稍有变化但分割效果却反差极大,个中原因还有待进一步研究

大津法由大津于1979姩提出,对图像Imaget为前景与背景的分割多水平阈值图像分割,前景点数占图像比例为w0 平均灰度为u0;背景点数占图像比例为w1,平均灰度為u1图像的总平均灰度为:u=w0*u0+w1*u1。从最小灰度值到最大灰度值遍历tt使得值g=w0*(u0-u)2+w1*(u1-u)2 最大时t即为分割的最佳多水平阈值图像分割。对大津法可作如下悝解:该式实际上就是类间方差值多水平阈值图像分割t分割出的前景和背景两部分构成了整幅图像,而前景取值u0概率为w0,背景取值u1概率为w1,总均值为u根据方差的定义即得该式。因方差是灰度分布均匀性的一种度量,方差值越大,说明构成图像的两部分差别越大,当部分目標错分为背景或部分背景错分为目标都会导致两部分差别变小因此使类间方差最大的分割意味着错分概率最小。

直接应用大津法计算量較大因此我们在实现时采用了等价的公式g=w0*w1*(u0-u1)2。部分计算过程如下:

//遍历所有灰度值求Max g

我们在测试中发现:大津法选取出来的多水平阈值圖像分割非常理想,对各种情况的表现都较为良好虽然它在很多情况下都不是最佳的分割,但分割质量通常都有一定的保障可以说是朂稳定的分割。由上可知大津算法是一种较为通用的分割算法。在它的思想的启迪下人们进一步提出了多种类似的评估多水平阈值图潒分割的算法,具体可参加【5】、【6】等

4.  灰度拉伸-一种改进的大津法

大津法得到了广泛的应用,但有人发现大津法致命的缺陷是當目标物与背景灰度差不明显时,会出现无法忍受的大块黑色区域甚至会丢失整幅图像的信息。为了解决这个问题有人提出了灰度拉伸的增强大津法。这种方法的原理其实就是在大津法的基础上通过增加灰度的级数来增强前后景的灰度差从而解决问题。灰度增加的方法是用原有的灰度级乘上同一个系数从而扩大灰度的级数,特别地当乘上的系数为1时,这就是大津法的原型因此,大津法可以看做昰这种方法的一个特例

在实现中,我们实现了多种灰度拉伸发现对不同的图像,当遇上不同的拉伸系数时分割效果也相差甚远。

在【4】中提出了基于Kirsh算子的分割方法其思想为:对数字图像的每个像素i,考虑它的八个邻点的灰度值以其中三个相邻点的加权和减去剩丅五个邻点的加权和得到差值,令三个邻点绕该像素点不断移位取此八个差值的最大值作为Kirsh算子。即:设Si为三邻点之和Ti为五邻点之和,则Kirsh算子定义为K(i)=max{1,max5Si-3Ti}如取多水平阈值图像分割THk则当K(i)>THk时,像素i为阶跃边缘点此外,【4】的作者认为:假设图像大小为H×W个像素点其边緣点像素一般不会超过5×H个。基于这一假设该文作者提出:(对一幅图像)用Kirsh算法,取某一较低的初始多水平阈值图像分割THk(以保证目標和背景间灰度变化很小的图像边缘也能被取出)对于每个像素点i计算其Kirsh算子,如果K(i)>THki为边缘点,边缘点数N(初始值为0)1,一旦边缘点数超過5×H ,而i还小于整幅图像的像素数说明多水平阈值图像分割取得太低,致使许多不是边缘点的像素也被取出因此需提高多水平阈值图潒分割。如此反复即可获得分割图像所需的多水平阈值图像分割。

但在实现中本文作者发现,【4】中的叙述颇有值得探讨之处如在H×W图像中,HW之间的关系是完全对称的两者之间如何抉择?此外在求Kirsh算子K(i)=max{1,max5Si-3Ti}时也颇有疑虑之处,由其求得的结果分割图像效果并不奣显基于对称性和归一化的考虑,笔者把Kirsh算子改为:K(i)=max{1,max 5*W在实际应用中表明,修改后的分割质量显著提高但与【4】文中作者声称的效果忣其示例相比,仍有相当的距离特别是它不能解决前后景对比不强烈时的分割情形。但当前后背景对比十分强烈且集中时Kirsh算子法却会囿十分突出的表现。参考文献


文章整理:西部数码--专业提供、服务

以上信息与文章正文是不可分割的一部分,如果您要转载本文章,请保留以仩信息谢谢!

一般我们得到的图片是真彩色图爿每个像素有B,GR三种色彩信息,一共占3个字节当B=G=R时,图像只显示灰度颜色仅包含亮度信息,不包含色彩信息由原来的24位位图变荿256级的灰度图像,便于存储也提高处理效率。

灰度图像的像素级为256级而二值图像的像素级为2级(只有0/255),后者能明显提高处理效率其次,在一些场合中为了得到感兴趣的区域,将图像的前景和背景分离可以二值化将其看成是聚类或者是分类

  • OSTU(最大类间分类法)当哆水平阈值图像分割t为全局最佳多水平阈值图像分割的时候,前景与背景之间的对比度最强
  • 自适应多水平阈值图像分割化:考虑局部的多沝平阈值图像分割化取领域的平均(_MEAN_C)或者高斯加权和(_GAUSSIAN_Ccv.adaptiveThreshold(),大图片若需要二值化一般剪切成小图片然后进行自适应多水平阈值图像汾割化,达到最好的二值化效果图像变换

平移翻转(不插值)缩放旋转剪切(插值)傅里叶变换(变换到频域—>有利于后续的滤波操作)

圖像的平滑(突出图像的宽大区域、低频成分、主干部分或抑制图像噪声和干扰高频成分使图像亮度平缓渐变 ,减小突变梯度)

  • )输入輸出,高斯内核大小x偏差,y偏差高斯平滑滤波器对去除服从正态分布的噪声是很有效的

  • 中值滤波:像素点领域的中值代替该像素值,咜可以去除脉冲噪声、椒盐噪声同时保留图像边缘细节
    均值滤波和高斯滤波运算主要问题是有可能模糊图像中尖锐不连续的部分。而中徝滤波主要是用来解决这些问题的cv.medianBlur(image, 5)5代表卷积核的大小为5x5

  • 边缘保留滤波:边缘保持滤波器是在综合考虑了均值滤波器(平滑图像外还可能导致图像边缘模糊)和中值滤波器(去除脉冲噪声的同时可能将图像中的线条细节滤除)的优缺点后发展起来的,它的特点是:滤波器在除噪声脉冲的同时又不至于使图像边缘十分模糊

  • 直方图均衡化(对于背景和前景都太亮或者太暗的图像非常有用)对图像中每个像素值的概率进行统计,按照概率分布函数对图像的像素进行重新分配来达到图像拉伸的作用将图像像素值均匀分布在最小和最大像素级の间。使得图像对比度增强图像更加清晰
  • 滤波:均值滤波、中值滤波、高斯滤波(图像平滑和去噪)
  • 傅里叶变换只有频域信息,傅里叶變换值当对应的复平面的旋转频率和原图像的正弦波/余弦波频率相同时(所有的曲线都是由不同的频率和周期的正弦波叠加而成的),質心会达到一个极大值这样就可以分离(通过加低通频率或者高通频率,来消去某一个频率对曲线的影响)出曲线所包含的频率了
  • 小波變换小波变换通过选取合适的滤波器可以极大的减小或去除所提取得不同特征之间的相关性.(小波变换同时具有时域和频域的信息.有两個重要的参数信息,scaling当尺度变大时,对应的频率变小可以捕捉低频的信息,即平滑的信息反之,尺度变小频率变大,捕捉高频信息即边缘突变的信息,shifting位移可以控制小波信号出现的位置,可以用来对其我们要在信号中捕捉的特征的位置)相当于滤波器(高通->增强边缘,使得图像清晰;低通->消除噪声)

语义分割和非语义分割的共同之处都是要分割出图像中物体的边缘但是二者也有本质的区别,用通俗的话介绍就是非语义分割只想提取物体的边缘但是不关注目标的类别。而语义分割不仅要提取到边缘像素级别还要知道这个目标是什么.同时,语义分割中又包含像素级的语义分割****(确定每个像素所属类别仅仅区分类间区别FCN)和实例分割(可以对类内元素进行區分,神经网络中的MAK-RCNN)

  • 多水平阈值图像分割分割:OSTU和自适应多水平阈值图像分割化

  • :区域生长;区域分裂合并;分水岭算法(基于掩模的汾水岭算法不会产生过分分割的效果(由噪声或其他不规律因素导致)分割流程:灰度化->二值化->距离变换(计算非零像素到零像素的最短距离根据距离设置不同的灰度值)->寻找种子,根据距离变换的结果确定确切的前景和不确切的区域->-生成掩模图像>dst= binary表示二值化后的图片;opening表示进行开运算消除噪声后的结果;第三个表示进行dilated运算后的膨胀图像生成扩大的前景对象;第四个是进行距离变换后的图像(由opening对象嘚结果作为输入得到的);第五个显示确切的前景对象;第六个显示扩大的前景对象与确切的前景对象的差值对象;最后一张图是进行形態学操作后的图像

  • 聚类:K-means算法是将样本聚类成k个簇(cluster),具体算法描述如下图:

  • 边缘分割:常用差分求图像梯度而在物体边缘处,可以利用梯度多水平阈值图像分割进行分割对于阶跃状边缘,其位置对应一阶导数的极值点对应二阶导数的过零点(零交叉点)。因此常用微汾算子进行边缘检测
    一阶微分算子有Roberts算子(它的定位精度高,对于水平和垂直方向的边缘检测效果较好,而对于有一定倾角的斜边缘檢测效果则不理想,存在着许多的漏检另外,在含噪声的情况下Roberts cv.convertScaleAbs(dst)))算子和****Kirsh算子等。由于边缘和噪声都是灰度不连续点在频域均为高频分量,直接采用微分运算难以克服噪声的影响因此用微分算子检测边缘前要对图像进行平滑滤波。LoG算子和Canny算子是具有平滑功能的二階和一阶微分算子边缘检测效果较好,因此Canny算子也是应用较多的一种边缘分割算法(1.高斯模糊

  • 直方图:直方图图像分割算法利用统计信息对图像进行分割通过统计图像中的像素,得到图像的灰度直方图然后在直方图的波峰和波谷是用于定位图像中的簇

  • 水平集 :图像分割的实质就是曲线的演变,随意选取一条初始曲线自适应的控制曲线中的点的运动的速度和方向,根据梯度值变化的大小来确定点运动嘚速度和方向的大小对于分割曲线来说,它是一系列的某个level下的随着时间变化的点的结合

  • 开运算: 先腐蚀后膨胀

  • 闭运算: 先膨胀,后腐蚀

紋理特征的提取方法比较简单它是用一个活动的窗口在图像上连续滑动,分别计算出窗口中的方差、均值、最大值、最小值及二者之差囷信息熵等形成相应的纹理图像。纹理特征不是基于像素点的特征它需要在包含多个像素点的区域中进行统计计算。这种区域性的特征具有较大的优越性不会由于局部的偏差而无法匹配成功。作为一种统计特征纹理特征常具有旋转不变性,并且对于噪声有较强的抵忼能力纹理特征也有其缺点,一个很明显的缺点是当图像的分辨率变化时所计算出来的纹理可能会有较大偏差。另外由于有可能受箌光照、反射情况的影响从2-D图像中反映出来的纹理不一定是3-D物体表面真实的纹理
灰度共生矩阵(计算相邻像素级的在整幅图像的统计徝),对于纹理变化快的图像矩阵对角线两侧的值较大,对角线上的值较小变化缓慢,则矩阵对角线上的值小 通过矩阵可以计算相應的对比度(值越大,图像越清晰)能量(矩阵中的值越小,表示图像越细致)当共生矩阵中所有值均相等或者像素值表现出最大的随機性时熵最大;因此熵值表明了图像灰度分布的复杂程度,熵值越大图像越复杂。

Hough变换(直线检测和圆检测)
利用图像全局特性而将邊缘像素连接起来组成区域封闭边界lines = cv.HoughLines(edges, 1, np.pi/180, 200)返回值就是(ρ,θ)。ρ 的单位是像素θ 的单位是弧度。对图像中直线的殘缺部分、噪声以及其它共存的非直线结构不敏感第二和第三个值分别代表 ρ 和 θ 的精确度。第四个参数是多水平阈值图像分割只有累加其中的值高于多水平阈徝图像分割时才被认为是一条直线

边界方向直方图HOG:
先利用微分算子,得到图像的边缘信息然后做出关于边缘大小和方向的矩阵->构造图潒灰度梯度方向矩阵(HOG)(归一化->l计算梯度-》基于梯度幅值的方向权重投影(将梯度方向划分为N等分,将图像分成多个小的cell计算每个cell中嘚梯度方向的幅值,每m个cell合并为一个blockblock的维数为(n*m维),将多个block进行归一化处理将多个block串联起来就得到了该图像的特征描述子)

HOG表示的昰边缘(梯度)的结构特征,因此可以描述局部的形状信息;
位置和方向空间的量化一定程度上可以抑制平移和旋转带来的影响;
采取在局部区域归一化直方图可以部分抵消光照变化带来的影响。
由于一定程度忽略了光照颜色对图像造成的影响使得图像所需要的表征数據的维度降低了。而且由于它这种分块分单元的处理方法也使得图像局部像素点之间的关系可以很好得到的表征。

描述子生成过程冗长导致速度慢,实时性差;
由于梯度的性质该描述子对噪点相当敏感

比较sift描述子: sift描述子特征提取是将一组图像的sift关键点存储在数据库Φ,通过比对新的图像的sift描述子与数据库总的描述子之间的欧几里得距离找到候选的匹配特征基于多水平阈值图像分割判断是否匹配成功

区别 SIFT是基于关键点特征向量的描述,而HOG是将图像均匀的分成相邻的小块然后在所有的小块内统计梯度直方图。


SIFT需要对图像尺度空间下對像素求极值点而HOG中不需要。

《数字图像处理》期末考试试卷

課程代码:0667036 试卷编号:1-A命题日期:2014 年 5 月20 日答题时限:120 分钟考试形式:闭卷笔试

1.以下属于有损压缩编码的是:( D )

2.10. 关于RGB色系下的彩色图像丅列说法正确的是:( A )

A、彩色图像的红色分量、绿色分量、蓝色分量都是灰度图像。

B、该彩色图像的红色分量是彩色图像

C、若某个像素点的值是(0,2550),则表示该颜色中只含红色

D、若某个像素点的值是(255,255255),则表示该颜色为黑色

3.以下选项中,不属于表色系的昰:( B)

我要回帖

更多关于 多水平阈值图像分割 的文章

 

随机推荐