结合非局部信息截集核可能性聚类的图像分割算法 下载: 683次
1 引言
图像分割技术是数字图像处理领域中一个重要的研究方向。目前,聚类算法在图像分割[1-4]中的应用最为广泛,常用的聚类算法有硬聚类、模糊聚类和可能性聚类算法。模糊聚类算法引入模糊数学理论,使样本点对每个聚类中心的隶属度在[0,1]之间,约束条件为每个样本点到所有聚类中心的隶属度和为1,即每个样本点对聚类的影响是相同的,其中模糊C-均值(FCM)聚类算法[5]是典型的模糊聚类算法。但FCM聚类算法要求每个样本对各个类的隶属度和为1,导致样本中的噪声点或奇异值点会被赋予较大的隶属度,从而造成错误划分。为了解决该问题,Krishnapuram等[6]提出可能性C-均值(PCM)聚类算法,放弃了对隶属度归一化的限制,从而赋予噪声数据较小的隶属度,进而提高了算法的鲁棒性。
传统的模糊聚类算法很难对线性不可分的数据进行划分,因此将核方法引入聚类算法中,主要思想是利用特征映射将低维空间中的线性不可分数据映射到高维空间中。吕佳等[7]提出了核可能性C-均值(KPCM)聚类算法,样本特征通过分辨、提取、放大处理后,可以得到更精确的聚类结果。但该算法会削弱类间关系,进而导致中心重合问题。因此,人们提出了多种改进的PCM聚类算法[8-14]。Zhang等[15]提出了改进的PCM聚类算法,将样本到类中心的隶属度和典型性相乘的方式结合在一起。Xenaki等[16-18]对每一类隶属度添加了稀疏性约束,提出了一种基于稀疏理论的PCM聚类算法,通过判断优化方程是否有解确定噪声数据,从而排除噪声数据对结果的影响,但该算法对于远距离噪声没有效果。于海燕等[19-20]提出了截集式可能性C-均值(C-PCM)聚类算法,将β-截集的概念引入PCM聚类算法中,为每一类产生聚类核,然后修改聚类核中样本的隶属度,将各类之间的关系引入可能性聚类中,改善了PCM聚类算法一致性聚类的缺点,同时克服了PCM聚类算法对初始化和参数设置的敏感性。
传统的聚类算法对无噪声图像的分割效果较好,但忽略了图像的空间位置信息,受噪声、异常值和其他人为因素的影响较大。考虑到同一邻域内的像素彼此间存在一定的相关性,Ahmed等[21]将空间邻域项引入初始FCM目标函数中,提出结合邻域空间信息的模糊C-均值(FCM_S)聚类算法,使算法的抗噪声能力有了一定提升。Chen等[22]引入邻域均值和邻域中值空间信息,降低了FCM_S聚类算法的复杂度,提出了FCM_S1和FCM_S2两种改进的聚类算法,不仅加强了抗噪声能力,且计算复杂度低,但不能很好地保留图像细节,对微小区域的分割效果不理想。Krinidis等[23]提出了一种基于局部信息的模糊C-均值(FLICM)聚类算法,该算法考虑了图像的空间信息和灰度信息,引入了一种包含图像局部信息的模糊因子,提高了算法的鲁棒性,能有效保持图像细节。传统的均值滤波算法也被称为局部滤波算法,原因是只考虑了图像的邻域信息,而非局部均值滤波算法在利用局部信息的同时也充分利用了图像中的冗余信息,但两种算法都要对滤波窗口中的所有像素取平均值。Buades等[24]对像素的局部相关性进行了扩充,提出了一种新的非局部均值(NL-means)滤波算法,相比均值滤波算法,能最大程度地保持图像细节特征,像素的真实值由与其具有相似性的像素值来估计。在此基础上,何晶等[25]讨论了核空间上结合非局部均值滤波信息的图像分割。
本文将截集思想引入KPCM聚类算法中,提出了基于截集门限的核可能性C-均值(C-KPCM)聚类算法,针对特定数据点的典型性值引入类间关系,改善了KPCM聚类算法的中心重合问题。将C-KPCM聚类算法应用于噪声图像分割,利用图像的非局部均值滤波信息,产生了新的模糊因子,更好地利用了图像的空间信息,进一步提出了一种核空间与非局部均值滤波相结合的KPCM(C-KPCM-NLS)聚类算法,改善了噪声图像的分割效果。
2 基本原理
2.1 可能性C-均值聚类
PCM聚类算法[6]为FCM聚类算法的一种改进算法,不再对隶属度进行归一化,使隶属度表示数据点到聚类中心的典型值,即数据点到相应聚类中心的绝对距离。从而放松了类间关系,使数据集中的噪声点远离数据集中心,得到较低的隶属度,减弱了其对计算准确性的影响,增强了算法的鲁棒性。设数据集X由n个p维数据组成,可表示为X={x1,x2,…,xn}∈Rn×p,采用迭代方法求取目标函数JPCM的最小值,对样本数据集进行聚类,可表示为
式中,xi为样本集中第i个样本,
式中,K为整数,通常取K=1。典型值tki和聚类中心vk的迭代公式为
PCM聚类算法的步骤如下。
1) 依次设置典型值的加权指数m,聚类类别c,迭代误差门限ε,最大迭代次数T。同时对聚类中心vk进行初始化,初始迭代次数t=1。
2) 通过(4)式,计算并更新典型值tki。
3) 通过(3)式,计算并更新ηk。
4) 通过(5)式,更新聚类中心vk。
5) 当‖vk(t)-vk(t+1)‖<ε或t>T时停止迭代,输出典型值tki和聚类中心vk;否则,返回步骤2)进行下一次迭代。
2.2 核可能性C-均值聚类
PCM聚类算法改善了数据集中噪声点和奇异值点对聚类结果的影响,但传统的PCM聚类算法仅适用于团状凸数据,处理非凸数据时效果不理想。吕佳等[7]提出的KPCM聚类算法,将样本数据从低维空间非线性映射至高维特征空间,使有限的样本在高维空间中线性可分,对非凸数据也能取得理想的聚类结果,提高了算法的聚类性能。KPCM聚类算法是一种迭代聚类算法,通过最小化目标函数对样本数据进行分类,将PCM聚类算法的目标函数映射至高斯核空间中,其目标函数JKPCM可表示为
式中,tki满足(2)式,ηk为一正数,可表示为
式中,Φ(·)为非线性映射,表示将x∈Rp映射为Φ(x)∈Rq,q≫p。其中,
当取高斯核函数时,
式中,σ为高斯核函数的标准差,影响核函数作用范围。高斯核空间中第i个样本到第k个聚类中心的距离为
可将KPCM的目标函数简化为
在目标函数中引入Lagrange因子,通过计算偏导求出典型值tki和聚类中心vk
KPCM聚类算法的步骤如下。
1) 依次确定聚类个数c,加权指数m,最小迭代误差门限ε,最大迭代次数T。用FCM算法的聚类结果作为其初始聚类中心。
2) 根据(8)式计算高斯核空间中样本到中心点的高斯核距离。
3) 根据(7)式计算ηk。
4) 根据(12)式,更新典型值tki。
5) 根据(13)式,更新聚类中心vk。
6) 当‖vk(t)-vk(t+1)‖<ε或t>T时停止迭代,输出典型值tki和聚类中心vk;否则,返回步骤2)继续下一次迭代。
在高斯核空间采用模糊聚类算法对图像I(含‖I‖个像元)进行分割时,高斯核σ可表示为
式中,di=‖xi-
2.3 截集式可能性C-均值聚类
将类间关系加入PCM聚类算法中,可以解决PCM聚类算法中心重合的问题。利用β-截集为每一个类产生聚类核,然后选出位于聚类核内的数据点。将聚类核内的样本作为获胜样本,其典型值保持不变,非获胜样本的典型值置为0。C-PCM聚类算法的目标函数为
可将(17)式等价为
1) 如果max tki>β,则
2) 如果max tki≤β,则
根据(18)式、(19)式的约束条件,可将聚类核理解为每一个类多增加了一个超球体,对应边界的半径r可表示为
当数据点在聚类核内,对应典型值的范围为(β,1),其中0≤β≤1,数据点对其他类的隶属度置为0。当β=1时,C-PCM聚类算法就退化为PCM聚类算法。C-PCM聚类算法的具体步骤如下。
1) 依次给定聚类个数c,加权指数m,惩罚参数η,截集门限β,最小迭代误差门限ε,最大循环次数T。
2) 初始化聚类中心vk,初始迭代次数t=0。
3) 用(4)式更新典型值tki。
4) 修正典型值tki(t):如果tqi=max tki>β,根据(18)式修正;如果tqi=max tki≤β,根据(19)式修正。
5) 通过(5)式,更新聚类中心vk。
6) 如果‖vk(t)-vk(t+1)‖<ε或t>T则停止;否则,返回步骤3)。
3 本文算法
3.1 截集式核可能性聚类算法
C-PCM聚类算法利用截集的概念为每一类产生聚类核,保留位于聚类核中样本点对应的最大典型值,并将这些样本点对其他类的典型值置为0,将类间关系引入可能性聚类算法中,解决可能性聚类算法一致性聚类的缺点。但C-PCM聚类算法采用欧氏距离计算样本点到聚类中心的距离,只适用于球形数据。因此,借鉴KPCM聚类算法的策略改变距离测度,提出了截集式核可能性(C-KPCM)聚类算法。利用核距离替代欧氏距离,其目标函数JC-KPCM可表示为
C-KPCM算法在每次迭代过程中对典型值进行更新,利用截集门限β判定典型值的大小并产生聚类核。当核函数为高斯核函数时,最大隶属度tqi可表示为
可将(22)式等价为r=K(xi,vq)<1-
C-KPCM算法的步骤如下。
1) 依次给定聚类个数c,加权指数m,最小迭代误差门限ε,最大迭代次数T,惩罚参数η,截集门限β,用FCM聚类算法的聚类结果作为其初始聚类中心。
2) 根据(8)式计算高斯核空间中样本到中心点的高斯核距离。
3) 根据(7)式计算ηk。
4) 根据(12)式,更新典型值tki。
5) 修正典型值tki(t):当max tki>β时,根据(18)式修正;当max tki≤β时,根据(19)式修正。
6) 根据(13)式更新聚类中心vk。
7) 当‖vk(t)-vk(t+1)‖<ε或t>T时停止迭代,否则返回步骤2)继续迭代。
3.2 结合非局部空间信息的截集式核可能性聚类图像分割算法
3.2.1 非局部均值滤波算法
NL-means算法的基本思想:目标像素不仅与其周围的像素有某种联系,还与图像中的其他像素有关联,目的在于获得整幅图像的像素与目标像素所在分块之间的相似度。NL-means算法需在整个图像中计算像素间的相似度,即每计算一个像素点的相似度,都要计算该像素和整幅图像中其他像素点的相似度,图像较大时会导致计算量过大。NL-means算法的基本原理:根据图像的噪声大小确定搜索窗口和邻域窗口。邻域窗口在搜索窗口中滑动,通过线性计算得到邻域间的相似度以确定权值,相似度越高,权值越大。
对于一幅含有噪声的离散图像X={xi
式中,Ni为像素点i的方形邻域,w(i,j)为权值,满足0≤w(i,j)≤1和
权值w(i,j)可表示为
式中,h为控制滤波程度的参数,表示指数衰减的快慢,Z(i)为归一化常数,可表示为
参数h与(25)式中欧氏距离函数的权重相关。h越大,表示高斯函数的变化越平缓,对噪声的处理水平越高,但会影响图像的清晰度。h越小,表示边缘细节保留的越完整,但去噪能力较差。因此,实际应用中,应根据图像中噪声大小选择适合的h。
3.2.2 结合非局部空间信息的截集式核可能性聚类图像分割算法
在一幅图像中像素不仅与其邻域像素具有相似性质,有时也会和其非邻域像素具有相似的性质,因此,对图像进行分割时可以利用图像的非局部信息。为了提高C-KPCM聚类算法对噪声图像的分割效果,在C-KPCM聚类算法的目标函数中添加非局部邻域空间信息,即引入无参数模糊因子G'ki,以平衡抑制噪声和保留细节信息。基于非局部均值滤波图像像素值产生的模糊因子,提出了结合非局部空间信息的截集式核可能性(C-KPCM-NLS)聚类图像分割算法,其目标函数为
式中,tki满足(2)式,G'ki的更新可表示为
式中,
在高斯核空间,目标函数可表示为
式中,
C-KPCM-NLS聚类算法的具体步骤如下。
1) 依次给定聚类个数c,加权指数m,惩罚参数η,截集门限β,最小迭代误差门限ε,最大迭代次数T。
2) 噪声图像I通过自适应中值滤波算法进行平滑处理,得到图像I1。
3) 初始化聚类中心vk。
4) 根据(31)式,更新典型值tki。
5) 修正典型值tki(t):当max tki>β时,根据(18)式更新;当max tki≤β时,根据(19)式更新。
6) 根据(32)式,更新聚类中心vk。
7) 当‖vk(t)-vk(t+1)‖<ε或t>T时停止迭代,输出典型值tki和聚类中心vk;否则,返回步骤4)进行下一次迭代。
8) 根据最终得到的典型值tki和聚类中心vk,得到分割结果图I2。
4 实验结果及分析
4.1 分割质量评价方法
实验采用分割准确率(SA)[23]和峰值信噪比(PSNR)[25]评价图像的分割质量。SA以手工分割结果作为标准进行评价,可表示为
式中,‖Icorrect‖为正确归类的像素数量。
PSNR可客观定量评价算法的鲁棒性能,单位为dB,PSNR越大,表示算法的抗噪性能越好,可表示为
式中,XMAX为颜色灰度最大值,XMSE为原图像与分割处理后图像的灰度均方值,对于XMAX=255的灰度图像,可表示为
式中,Mi为原图像中对应像素的灰度值,M'i为分割处理后图像对应像素的灰度值。
4.2 人工合成图像测试
对人工合成图像(尺寸为200 pixel×200 pixel)分别添加三种类型的噪声:噪声为0.2的椒盐噪声(0.2)、均值为0,方差为0.2的高斯噪声(0,0.2)、椒盐噪声(0.1)和高斯噪声(0,0.1)的混合噪声,其中,截集门限β均为0.2。噪声图像如
图 1. 添加不同噪声的图像。(a)原始图像;(b)椒盐噪声;(c)高斯噪声;(d)混合噪声
Fig. 1. Images of add different noises. (a) Original image; (b) salt and pepper noise; (c) Gaussian noise; (d) mixed noise
图 2. 不同算法的分割结果。(a)椒盐噪声;(b)高斯噪声;(c)混合噪声
Fig. 2. Segmentation results of different algorithms. (a) Salt and pepper noise; (b) Gaussian noise; (c) mixed noise
从
表 1. 8种算法对噪声图像的SA
Table 1. SA of noisy images by 8 algorithmsunit: %
|
4.3 Berkeley图像测试
对Berkeley图像#42049(尺寸为312 pixel×481 pixel)分别添加上述三种类型的噪声,噪声图像如
图 3. 图像#42049。(a)原始图像;(b)椒盐噪声;(c)高斯噪声;(d)混合噪声
Fig. 3. Image #42049. (a) Original image; (b) salt and pepper noise; (c) Gaussian noise; (d) mixed noise
图 4. 不同算法的分割结果(#42049)。(a)椒盐噪声;(b)高斯噪声;(c)混合噪声
Fig. 4. Segmentation results of different algorithms (#42049). (a) Salt and pepper noise; (b) Gaussian noise; (c) mixed noise
从
表 2. 不同算法分割结果(#42049)
Table 2. Segmentation results of different algorithms (#42049)
|
4.4 自然图像测试
对自然图像Cameraman(尺寸为256 pixel×256 pixel)分别添加三种类型的噪声:噪声为0.2的椒盐噪声(0.2)、均值为0,方差为0.08的高斯噪声(0,0.08)、椒盐噪声(0.05)和高斯噪声(0,0.05)的混合噪声,其中,截集门限β均为0.5,结果如
图 5. 图像Cameraman。(a)原始图像;(b)椒盐噪声;(c)高斯噪声;(d)混合噪声
Fig. 5. Image Cameraman. (a) Original image; (b) salt and pepper noise; (c) Gaussian noise; (d) mixed noise
图 6. 不同算法的分割结果(Cameraman)。(a)椒盐噪声;(b)高斯噪声;(c)混合噪声
Fig. 6. Segmentation results of different algorithms (Cameraman). (a) Salt and pepper noise; (b) Gaussian noise; (c) mixed noise
由
表 3. 不同算法分割结果的PSNR(Cameraman图像)
Table 3. PSNR of segmentation results by differentalgorithms (Cameraman image)unit: dB
|
5 结论
针对KPCM聚类算法中心重合的问题,提出了C-KPCM聚类算法,利用β-截集为每一个类产生聚类核,通过修正典型值,引入类间关系,解决了核可能性聚类算法中一致性聚类的问题。为了提高C-KPCM聚类算法的抗噪声性能,利用图像的非局部信息代替图像的局部信息,生成一种新的模糊因子,提出了C-KPCM-NLS聚类算法,增强了算法的抗噪性能。实验结果表明,本算法对含有椒盐噪声、高斯噪声以及混合噪声的图像分割效果较好,且算法的鲁棒性更好。
[1] Bai X Z, Chen Z G, Zhang Y, et al. Infrared ship target segmentation based on spatial information improved FCM[J]. IEEE Transactions on Cybernetics, 2016, 46(12): 3259-3271.
[2] Wan L, Zhang T, Xiang Y M, et al. A robust fuzzy C-means algorithm based on Bayesian nonlocal spatial information for SAR image segmentation[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2018, 11(3): 896-906.
[3] Ngatchou A, Bitjoka L, Mfoumou E, et al. Robust and fast segmentation based on fuzzy clustering combined with unsupervised histogram analysis[J]. IEEE Intelligent Systems, 2017, 32(5): 6-13.
[4] 兰蓉, 赵强. 双中心组合迭代抑制式模糊C-均值聚类图像分割算法[J/OL].控制与决策. [2019-12-27].http:∥gb.oversea.cnki.net/KCMS/detail/21. 1124. TP. 20190401.1626.014.html.
LanR, Zhao Q. Suppressed fuzzy C-means clustering image segmentation algorithm based on combined iteration with double centers[J/OL]. Control and Decision. [2019-12-27].http:∥gb.oversea.cnki.net/KCMS/detail/21. 1124. TP. 20190401.1626.014.html.
[5] BezdekC. Pattern recognition with fuzzy objective functions algorithms[M]. New York: Plenum Press, 1981.
[6] Krishnapuram R, Keller J M. A possibilistic approach to clustering[J]. IEEE Transactions on Fuzzy Systems, 1993, 1(2): 98-110.
[7] 吕佳, 熊忠阳. 基于核的可能性聚类算法[J]. 计算机工程与设计, 2006, 27(13): 2466-2468.
Lü J, Xiong Z Y. Kernel-based possibilistic clustering algorithm[J]. Computer Engineering and Design, 2006, 27(13): 2466-2468.
[8] Ferraro M B, Giordani P. On possibilistic clustering with repulsion constraints for imprecise data[J]. Information Sciences, 2013, 245: 63-75.
[9] Askari S, Montazerin N. Zarandi M H F, et al. Generalized entropy based possibilistic fuzzy C-means for clustering noisy data and its convergence proof[J]. Neurocomputing, 2017, 219: 186-202.
[10] Sarkar J P, Saha I, Maulik U. Rough possibilistic type-2 fuzzy C-means clustering for MR brain image segmentation[J]. Applied Soft Computing, 2016, 46: 527-536.
[12] Timm H, Borgelt C, Döring C, et al. An extension to possibilistic fuzzy cluster analysis[J]. Fuzzy Sets and Systems, 2004, 147(1): 3-16.
[13] Pal N R, Pal K, Keller J M, et al. A possibilistic fuzzy C-means clustering algorithm[J]. IEEE Transactions on Fuzzy Systems, 2005, 13(4): 517-530.
[14] Li F Q, Wang S L, Liu G S. A Bayesian possibilistic C-means clustering approach for cervical cancer screening[J]. Information Sciences, 2019, 501: 495-510.
[15] Zhang J S, Leung Y W. Improved possibilistic C-means clustering algorithms[J]. IEEE Transactions on Fuzzy Systems, 2004, 12(2): 209-217.
[16] Xenaki SD, Koutroumbas KD, Rontogiannis AA. Sparse adaptive possibilistic clustering[C]∥2014 IEEE International Conference on Acoustics, May 4-9, 2014, Florence, Italy. New York: IEEE, 2014: 3072- 3076.
[17] Xenaki S D, Koutroumbas K, Rontogiannis A A. Sparsity-aware possibilistic clustering algorithms[J]. IEEE Transactions on Fuzzy Systems, 2016, 24(6): 1611-1626.
[18] Koutroumbas K D, Xenaki S D, Rontogiannis A A. On the convergence of the sparse possibilistic C-means algorithm[J]. IEEE Transactions on Fuzzy Systems, 2018, 26(1): 324-337.
[19] 于海燕. 弱模糊划分聚类算法与基于模糊集理论的图像分割方法研究[D]. 西安: 西安电子科技大学, 2018.
Yu HY. Studies on clustering algorithms based on weak fuzzy partition and image segmentation methods based on fuzzy set theory[D]. Xi'an:Xidian University, 2018.
[20] Yu H Y, Fan J L. Cutset-type possibilistic C-means clustering algorithm[J]. Applied Soft Computing, 2018, 64: 401-422.
[21] Ahmed M N, Yamany S M, Mohamed N, et al. A modified fuzzy C-means algorithm for bias field estimation and segmentation of MRI data[J]. IEEE Transactions on Medical Imaging, 2002, 21(3): 193-199.
[22] Chen S C, Zhang D Q. Robust image segmentation using FCM with spatial constraints based on new kernel-induced distance measure[J]. IEEE Transactions on Systems, Man, and Cybernetics, Part B (Cybernetics), 2004, 34(4): 1907-1916.
[23] Krinidis S, Chatzis V. A robust fuzzy local information C-means clustering algorithm[J]. IEEE Transactions on Image Processing, 2010, 19(5): 1328-1337.
[24] BuadesA, CollB, Morel JM. Image denoising by non-local averaging[C]∥Proceedings.( ICASSP'05). IEEE International Conference on Acoustics, Speech, and Signal Processing, 2005, March 23-23, 2005, Philadelphia, PA, USA. New York: IEEE, 2005, 2: 60- 65.
[25] 何晶, 吴成茂. 核空间自适应非局部均值鲁棒分割算法[J]. 光电子·激光, 2017, 28(8): 910-917.
He J, Wu C M. Kernel space adaptive non-local means robust segmentation algorithm[J]. Journal of Optoelectronics·Laser, 2017, 28(8): 910-917.
Article Outline
范九伦, 闫阳, 于海燕, 梁丹, 高梦飞. 结合非局部信息截集核可能性聚类的图像分割算法[J]. 激光与光电子学进展, 2020, 57(18): 181010. Jiulun Fan, Yang Yan, Haiyan Yu, Dan Liang, Mengfei Gao. Image Segmentation Algorithm Combining Non-Local Information Interception Kernel Possibilistic Clustering[J]. Laser & Optoelectronics Progress, 2020, 57(18): 181010.