光学学报, 2020, 40 (16): 1610003, 网络出版: 2020-08-07   

基于文化狼群算法的电力设备红外和可见光图像配准 下载: 894次

Power Equipment Infrared and Visible Images Registration Based on Cultural Wolf Pack Algorithm
作者单位
华北电力大学电气与电子工程学院, 河北 保定 071003
摘要
可见光和红外图像是电力巡检机器人检测电力设备健康状态的重要方式,图像配准可以结合两类图像的优势,为后续状态监测提供更好的依据。针对红外图像模糊导致的配准精度下降问题,提出了一种基于显著性梯度的归一化互信息算法。首先,在红外图像视觉显著性检测的基础上,强化了显著性区域的边缘梯度信息;然后,将显著性梯度信息和归一化互信息相结合作为配准的测度函数;其次,为了提高图像配准算法的收敛性,提出了一种文化狼群算法。该算法将文化算法的分层进化特点引入狼群算法,建立信念空间和群体空间。在迭代过程中,通过信念空间的知识指导群体空间的进化。最后,选取变电站巡检图像、标准配准测试图像集和标准测试函数进行对比实验,结果表明,该算法在配准率和配准速度方面的性能较好。
Abstract
Visible and infrared images are important ways for power inspection robot to detect the health status of power equipment. Image registration can combine the advantages of two types of images and provide a better basis for subsequent status monitoring. To improve the registration accuracy due to the blur of infrared image, this paper proposes a normalized mutual information algorithm based on saliency gradient. First, based on the visual saliency detection of the infrared image, the edge gradient information of saliency area is enhanced. Second, the saliency gradient information and normalized mutual information are combined as a measurement function of registration. Third, to improve the convergence of the image registration algorithm, a cultural wolf pack algorithm is proposed. This algorithm introduces the hierarchical evolutionary characteristics of cultural algorithm into the wolf pack algorithm to establish the belief space and population space. In the iterative process, the evolution of population space is guided by the knowledge of belief space. Finally, the substation inspection image, standard registration test image set, and standard test functions are selected for comparative experiments. The results show that the proposed algorithm has better performance in registration rate and registration speed.

1 引言

红外热像仪作为反映电力设备热故障的主要组件,被广泛装备在巡检机器人中。但红外成像受环境温差、测量距离和大气状态的影响较大,当被测物体和环境温度相近时,难以有效识别电力设备的具体信息[1]。相比红外图像,可见光图像具有更多的细节信息。因此,将红外和可见光图像配准后,可以在显示设备热成像的同时,进行精准的故障定位。高效、精准的图像配准是提高巡检机器人故障定位和识别能力的前提。图像配准的步骤包括选择相似性测度算法、确定变换模型、图像插值、优化策略[2]

目前相似性测度算法主要包括归一化互相关(NCC)[3]、互信息(MI)[4]和误差平方和(SSD)算法[5],其中MI算法在红外和可见光图像的配准中应用最为广泛。闫利等[6]在归一化互信息算法的基础上结合梯度和灰度信息进行图像配准。Yang等[7]将高斯滤波引入局部张量,利用自适应局部结构张量提取空间信息,并通过加权函数和MI组成测度函数,充分反映了像素的邻域信息。刘小燕等[8]通过线性滤波提取图像边缘,并将边缘信息和MI相结合,弥补了MI中空间信息不足的问题。Yu等[9]提出了基于灰度窗口法的归一化互信息(GWW-NMI)算法,利用窗口法改变灰度权重,提取强边缘特征,解决了红外和可见光图像之间的特征不一致问题。上述算法都侧重于将全局边缘特征或点特征和MI结合,但实际应用中,巡检机器人的红外图像会受到振动、温度和室外灰尘等因素的影响,造成图像模糊,进而导致配准精度下降。

图像配准中的优化策略是在配准精度和速度之间达到最佳平衡,目前主要通过在可行解空间中寻求全局最优解。Wang等[10]将无味卡尔曼滤波器引入粒子群中,改善其收敛过早的问题。Liu等[11]开发了一种基于条件初始化和并行协作的并行粒子群优化算法(pa-PSO),以加快收敛速度并进一步减少失配。Pradhan等[12]提出了细菌觅食-量子粒子算法,该算法兼顾收敛速度和全局最优,适用于非刚性配准。除粒子群优化算法外,Chen等[13]针对面部红外图像配准,为减小因图像晃动引起的配准误差,提出两阶段遗传算法。但这类算法自身缺乏群策能力,具有收敛性不足、全局最优解搜索能力和环境适应性较差等问题。Wu等[14]提出了狼群算法,在算法中融入了狼群中的综合决策和逻辑推理能力。Chen等[15]通过对比其他智能种群算法,证明了狼群算法的鲁棒性和收敛速度较好,但该算法依然存在狼群搜索方式单一,搜索步长死板等问题,容易导致在图像配准这类高维函数的求解中,陷入局部最优解。

首先,为提高红外和可见光图像的配准适应性,在红外图像低清晰度的情况下保证配准效果,本文提出了一种结合显著性梯度和MI的方法。通过视觉显著性分析提取红外图像的显著性梯度特征,并用基于显著性梯度的归一化互信息(SGNMI)作为测度函数,弥补了归一化互信息的空间信息不足问题。其次,为了提高巡检过程中的图像配准效率,根据电力巡检机器人拍摄的红外和可见光图像特点,提出了一种适用于图像配准的文化狼群算法(CWPA)。借鉴文化算法的多层进化机制[16],并结合改进的狼群算法,改善了传统狼群算法在配准中效果较差的问题。最后,通过对比实验验证了本算法的有效性。

2 基于显著性梯度的归一化互信息测度

电力设备出现异常高温情况,说明设备出现异常,且高温区域在红外图像中是显著的。在巡检图像中,红外和可见光图像的背景一般为自然景观(如天空),在灰度强度分布上和图像中的电力设备存在较大差异。文献[ 17]中基于流形排序的显著性检测算法就是利用像素块与先验背景的差异计算目标的显著性。因此,根据文献[ 17]中的算法提出了一种SGNMI测度算法,该算法的流程如图1所示。

图 1. SGNMI测度算法的流程图

Fig. 1. Flow chart of SGNMI measurement algorithm

下载图片 查看所有图片

2.1 归一化互信息测度

MI是关于信息论的重要理论,常用于信息关联性的度量。在图像配准中,将两个待配准的图像视为两个随机变量,利用互信息统计图像之间的相关性进行配准。通过图像变换使两图像的互信息达到最大时,完成配准。图像A和图像B的互信息可表示为

I(A,B)=H(A)+H(B)-H(A,B),(1)H(A)=-aApA(a)log2pA(a),(2)H(B)=-bBpB(b)log2pB(b),(3)H(A,B)=-aAbBpAB(a,b)log2pAB(a,b)pA(a)pB(b),(4)

式中,H(A)、H(B)分别为图像AB的熵,H(A,B)为图像AB的联合熵,pA(a)、pB(b)分别为图像AB的概率密度,其中,ab分别为图像AB的对应像素,pAB(a,b)为图像AB的联合概率密度。为进一步减小图像灰度强度对互信息测度的影响,根据联合熵与个体熵之间的关系,将归一化互信息表示为

NMI(A,B)=H(A)+H(B)H(A,B)(5)

2.2 基于显著性梯度的归一化互信息测度

流形排序算法是一种综合考虑前景和背景相似性的视觉显著性算法[17],该算法可以提取红外图像中的显著性区域,具体步骤如图2所示。根据显著性检测原理将红外图像分为显著性区域和非显著性区域,图2(b)中的区域1为显著性区域,区域2为非显著性区域。以图像S中的单个像素S为例,区分方法可表示为

Xsig(S1)>Xmean[S],Xsig(S2)Xmean[S],(6)

式中,Xsig为对应像素的显著性,Xmean为图像中所有像素显著性的均值,S1为显著性区域的像素,S2为非显著性区域的像素。红外图像的划分结果如图2(c)所示,其中,显著性区域主要是电力设备的主体区域;非显著性区域主要是背景区域。

图 2. 红外图像的显著性梯度。(a)原始图像;(b)显著性检测图像;(c)划分后的红外图像;(d)增强显著性区域的图像;(e)显著性梯度图像

Fig. 2. Saliency gradient of infrared image. (a) Original image; (b) image after saliency detection; (c) infrared image after division; (d) image after enhancing the saliency area; (e) image of saliency gradient

下载图片 查看所有图片

将图像进行区域划分后,对图像进行直方图均衡化以提高红外图像显著区域的对比度,突出边缘信息。如图2(d)所示。直方图均衡化后的图像可表示为

h(st)=Xround(L-1)×f(st)-fmin(W×H)-fmin,(7)f(st)=j=0stp(j),(8)

式中,p(j)为像素强度值为j的像素点在图像中出现的概率,f(st)为图像的像素强度值累计分布函数,fmin为累计分布函数的最小值,WH分别为图像长、宽的像素个数,L为灰度等级,在红外图像中为256,st为原始图像的像素强度值。通过增强红外图像中电气设备区域的对比度,可提高该区域内像素强度值的梯度,克服因红外图像边缘模糊而导致的有效梯度信息缺失问题。提取整个红外图像的显著性梯度,可表示为

I(x,y)=I(x,y),I(x,y)>Th0, other,(9)Th=1MNxNyMI(x,y),(10)

式中,Th为强梯度提取的阈值,ÑI(x,y)为图像在xy方向上的梯度值,不包含梯度方向,NM分别为在xy方向上的梯度数量。(9)式和(10)式可以有效提取红外图像显著区域的梯度分布,减少无关信息的影响。由于增强部分区域对比度提高了强梯度的提取阈值Th,但非显著性区域的部分“强梯度”依然大于阈值Th。因此,通过提高梯度阈值筛选出的全局显著性梯度,倾向于分布在出现异常温升的电力设备中。从图2(e)中可以发现,显著性梯度点主要分布在电力设备的周围,且在背景中较少,从而使基于显著性梯度的测度函数侧重反映电气设备区域的配准效果。按照(9)式提取可见光图像的显著性梯度,结果如图3所示。可以发现,提取的可见光图像梯度点不倾向于任何区域,如图3(b)所示。

图 3. 可见光图像的显著性梯度。(a)可见光图像;(b)显著性梯度图像

Fig. 3. Saliency gradient of visible image. (a) Visible image; (b) image of saliency gradient

下载图片 查看所有图片

将两组显著性梯度视为两组随机变量,在(5)式的基础上组成新的SGNMI测度函数

SSGNMI(A,B)=H(ASG)+H(B)H(ASG,B),(11)

式中,ÑASG为基于显著性区域划分的红外图像显著性梯度,ÑB为可见光图像的显著性梯度。该测度函数主要衡量两个图像之间的显著性梯度相似性,当两幅图像完全配准时,SGNMI测度函数达到最大值,即将优化配准过程转化为求解SGNMI测度函数最大值的问题。可表示为

Tb=argmaxSSGNMI[A,T(B)],(12)T=qcosr-qsinrhqsinr qcosrv001,(13)

式中,Tb为通过优化算法求得的最佳空间变换矩阵,T为空间变换矩阵,T(B)为利用空间变换矩阵对图像B进行仿射变换,hvqr分别为待配准图像在配准过程中的水平平移量、竖直平移量、缩放率和旋转角度。

3 狼群算法及分析

假设狼群算法(WPA)[14]包括3种人工狼(探狼、头狼、猛狼),3种寻优行为(探狼游走行为、头狼召唤行为、猛狼围攻行为)和2种智能规则(胜者为王的头狼角逐规则、强者生存的狼群更新规则)。WPA可表示为

XWPA={N,iter,X,Y,L},(14)

式中,N为三种人工狼的总数量,iter为总迭代次数,X为人工狼的位置状态,其中Xi=(xi1,xi2,…,xiD)为第i(i=1,2,…,N)匹人工狼在D维空间中的位置状态。Y为人工狼感知到的猎物气味浓度,其中,探狼为Ya、猛狼为Yb、头狼为YcL为步长因子,包括游走步长L(a)、奔袭步长L(b)和围攻步长L(c)。算法的主要步骤如下。

1) 游走行为

游走行为的目的是更新探狼的信息,第i匹探狼始终向着最优方向进化。向p(p=1, 2, …,h)方向更新的探狼在第d维空间中的位置可表示为

x(a)id(p)=x(a)id+sin(2π×p/h)×L(a)d,(15)

式中,x(a)idx(a)id(p)为探狼i更新前后的位置,L(a)dd(d=1, 2, …,D)维空间中探狼的游走步长。在h个方向中,取气味浓度最大且大于当前气味浓度Yai的方向作为该探狼的更新方向。重复上述游走行为,直到游走达到最大步数Tmax。或按照胜者为王的机制,出现Yai>Yc时停止,此时探狼i成为头狼。

2) 召唤行为

通过游走行为找到气味最浓的头狼位置,将第i匹猛狼向头狼的位置快速靠近,该猛狼在第k+1次迭代后的位置可表示为

x(b)id(k+1)=x(b)id(k)+L(b)d×(gd(k)-x(b)id(k))/gd(k)-x(b)id(k),(16)

式中, x(b)id(k)x(b)id(k+1)为该猛狼在d维空间更新前后的位置,L(b)d>2L(a)d为猛狼的奔袭步长, gd(k)k次迭代时头狼在d维空间的位置。猛狼在奔袭中始终遵循胜者为王的更新机制,直到猛狼和头狼的距离dbi小于围攻范围dnear时,结束召唤。

3) 围攻行为

猛狼奔袭后将头狼的位置作为猎物目标,在围攻范围dnear内的所有猛狼都发起围攻。第k+1次的围攻行为可表示为

x(b)id(k+1)=x(b)id(k)+λ×L(c)d×Gd(k)-xid(k),(17)

式中,λ为[-1, 1]的均匀随机数,L(c)d为猛狼的围攻步长,且L(a)d>2L(c)d, Gd(k)为猎物第k次迭代时在d维空间的位置。

狼群算法在强者生存的更新机制下进行循环寻优,直到达到最大迭代次数或种群最优解预定误差精度时停止。但传统狼群算法中,存在以下不足。

1) 游走行为反映了算法的全局最优解感知能力,但当探狼陷入局部最优解且无法成为头狼时,按(15)式的算法探狼会困在局部最优点,搜索能力下降。

2) 在算法迭代过程中,狼群向最优解区域靠近,猛狼的围攻范围应由大到小,而传统狼群算法的围攻半径是固定的。

3) 探狼应在迭代过程中,通过当前的进化状况确定游走步长,以达到最佳的搜索速度。

4 文化狼群优化算法

为了解决传统狼群算法中存在的问题,同时提高图像配准的速度和精度,提出了适用于图像配准的CWPA。CWPA从微观和宏观层面上模拟生物层面和文化层面的进化,种群空间和信念空间构成的双层进化机制使算法具有良好的全局搜索能力和收敛性[16],CWPA的框架如图4所示。

图 4. CWPA的原理图

Fig. 4. Schematic diagram of CWPA

下载图片 查看所有图片

4.1 狼群算法的改进及群体空间设计

群体空间是算法进行问题求解的主空间,实验采用改进的WPA进行演化。传统WPA中,探狼采用贪婪式游走策略,始终向着比当前更优的方向前进,容易陷入局部最优解。且猛狼在迭代到一定次数时,应在一定范围内,进行细致的搜索,以加快收敛速度。因此,采用(14)式中的5个参数作为群体空间的主要内容,对算法进行改进。

首先,为了提高探狼对局部最优解的感知能力,防止陷入局部最优解。在探狼游走期间(Yai<Yc),当探狼i周围h个方向的气味浓度均小于探狼当前的气味浓度时,改变搜索半径。经多次循环后,若当前探狼周围h个方向的气味浓度依然小于探狼i位置的气味浓度,表示出现极大值。此时在搜索范围外随机初始化探狼i的位置。探狼i出现局部最大值时,满足

Y(x(a)id)>Y[x(a)id+sin(2π×p/h)×0.5η×L(a)d],p=1,2,,hY(x(a)id)<Yc,(18)

式中,Y(x(a)id)为探狼id维空间的气味浓度,η∈[0, 2]为随机设定的搜索半径因子,通过多次取搜索半径因子的方式不断改变搜索范围,进而确定当前区域是否存在局部最大值。

其次,在迭代初期,猛狼应在较大的范围内进行围攻。随着迭代次数的增加,应逐渐缩小围攻范围,以加速算法的收敛。实验使用的动态围攻半径dnear在第k次迭代的更新可表示为

dnear(k)=iter/(ω×iter+k)D×d=1DXdmax-Xdmin,(19)

式中,ω∈(0, 1)为随机数, XdmaxXdmin分别为d维变量的最大值和最小值。通过(19)式改变召唤行为中的停止条件,同时增加围攻范围的约束条件。随着迭代次数k的增加,围攻半径逐渐减小,从大范围的粗糙搜索转向小范围的精细搜索,提高了算法的收敛性。

4.2 信念空间的设计

信念空间可以保存群体进化过程中的优秀种群,形成群体知识指导种群进化。信念空间的知识形式包括状况知识、规范知识、拓扑知识、领域知识和历史知识[18]。可以根据进化策略和应用领域选择不同的知识形式。由于传统WPA中,人工狼步长选择具有随机性,应选择规范知识作为信念空间,用于描述可行解搜索空间的变化。针对D维变量,其结构描述为{N1,N2, …,ND},其中,Nd= (ed,ud),(Ed,Ud),edud分别为d维空间的上限和下限,EdUd分别为变量对应的适应值上限和下限。随着种群的进化,个体应在更有效的范围内寻找最优解。为了指导群体空间的进化,规范知识的第k次迭代可表示为

ed(k+1)=xid(k),xid(k)<ed(k)f[xid(k)]>Eid(k)ed(k), otherEd(k+1)=f[xid(k)],xid(k)<ed(k)f[xid(k)]>Eid(k)Ed(k), otherud(k+1)=xid(k),xid(k)>ud(k)f[xid(k)]>Uid(k)ud(k), otherUd(k+1)=f[xid(k)],xid(k)>ud(k)f[xid(k)]>Uid(k)Ud(k), other,(20)

式中,xid(k)为第k次迭代中从群体空间挑选的人工狼id维参数,f(·)为适应度函数,即目标函数。

4.3 接受函数

接受函数将群体空间中的最优子集提供给信念空间,一般按照一定百分比或者一定的规则进行提取。在迭代过程中,种群空间中的人工狼会随种群逐渐向最优解靠拢,个体间的位置越来越接近。如果按照规定的比例系数进行更新会导致接受算法的信息传递效率低,因此,将种群按适应度划分为两个种群,其中,适应度较大的种群N1占20%,适应度较小的种群N2占80%。选取最优子集的方法可表示为

xid-xjd>ε,xid,xjdN1,(21)

式中,ε为阈值参数,‖·‖为欧氏距离。通过(21)式,在选取最优子集的过程中,保证传递个体间差异的同时,种群随迭代不断聚拢。因此,最优子集包含的个体数会随迭代次数的增加呈下降趋势,保证了信息传递的高效性和种群的多样性。

4.4 影响函数

影响函数将信念空间的知识按照一定规则传递到群体空间,以指导种群的进化。通过规范知识决定人工狼的前进步长,优化搜索范围。种群空间中探狼的游走步长一般设为定值L(a)d,规范知识指导游走步长可表示为

L(a)d=ed+Xrand(0,1)×(ud-ed),(22)

式中,Xrand(0,1)为[0, 1]之间的随机数,以避免在迭代后期,人工狼陷入局部最优解。在(19)式的基础上,将信念空间的知识传递至围攻半径函数dnear,

dneark=iter/(ω×iter+k)D×d=1Dud-ed(23)

4.5 本文配准算法

结合SGNMI算法,将CWPA用于红外图像和可见光图像的配准。CWPA的具体步骤如下。

1) 初始化设置的参数:随机初始化人工狼i的空间位置Xi,包括hvqr,群体空间种群大小N,最大迭代次数iter,探狼游走行为的最大游走次数Tmax,阈值参数ε,更新比例因子β

2) 根据群体空间中人工狼的位置,计算所有人工狼i的适应度Yai(两幅图像的SGNMI测度函数),并选取头狼。

3) 探狼按照(15)式进行游走,根据(18)式去除探狼中的局部极大值。如果满足Yai>Yc,则转至步骤2),若达到最大游走次数Tmax,则转至步骤4)。

4) 猛狼按照(16)式进行奔袭。如果满足Ybi>Yc,则转至步骤2)。直到猛狼达到(23)式的围攻范围后,根据(17)式进行围攻。并按照强者生存的更新机制,完成群体空间人工狼的位置及适应度的更新。

5) 通过(21)式更新信念空间,通过(20)式更新信念空间内人工狼的变量范围、位置和适应度值,通过(22)式和(23)式指导游走步长L(a)d和围攻半径dnear

6) 当误差达到最初设定值或迭代到最大次数时,输出群体空间头狼对应的最佳空间变换矩阵和目标函数值;否则,返回步骤2)。

5 实验分析

实验提出了新的SGNMI测度函数和CWPA,分别对测度函数和优化算法进行对比实验。算法的开发环境:处理器为Intel(R) Core(TM) i5-5200U,CPU为2.20 GHz,内存为8 G,操作系统为64位Windows10,开发平台为Matlab 2019b。

5.1 测度函数对比实验

测度函数的对比实验采用3种不同的MI测度函数:GWW-NMI[9]、SGNMI和基于综合空间的互信息(SMI)算法[19]。其中,SMI和GWW-NMI算法都是结合图像空间特征和MI的测度函数,在红外和可见光图像配准中效果较好[9,19]。为了使测度函数对比实验的结果更加可靠,用文献[ 20]中的文化粒子群优化(CPSO)算法优化三种测度函数中的4个配准参数。配准参数的解空间如表1所示。

表1的解空间内随机选取配准参数的初始化值,CPSO算法的初始化参数按文献[ 20]给出的最佳参数设置,如表2所示。

表 1. 配准参数的解空间

Table 1. Solution space of registration parameters

Registration parameterhvqr
Solution space[-1000,1000][-1000,1000][-10,10][0,360]

查看所有表

表 2. 优化算法参数设置

Table 2. Parameters of optimization algorithm

AlgorithmParameter
CPSON=100, iter=2000, inertia weight ω=0.7, learning factor c1=c2=1.5, individual speed limit [-0.5, 0.5]
WPAN=100, ferocious wolves∶scout wolves=1∶1, iter=2000, Tmax=10, step factor S=0.1; judging distance d=0.08, update scale factor β=3
CWPAN=100, ferocious wolves∶scout wolves=1∶1, Tmax=10, threshold parameter ε=0.5, update scale factor β=3

查看所有表

采用归一化测度函数、均方根误差(RMSE)和平均绝对误差(MAE)评价测度函数的图像配准效果[3]。其中,均方根误差XRMSE和平均绝对误差XMAE可表示为

XRMSE=1Qq=1Q[(x1q-x2q)2+(y1q-y2q)2],(24)XMAE=1Qq=1Qx1q-x2q+y1q-y2q,(25)

式中,( x1q, y1q)和( x2q, y2q)分别为红外和可见光图像中的第q对匹配点,Q为匹配点对的数目。实验中的测试图像由标准配准数据集提供,将自建数据集中的图像按标准配准数据集的标注格式进行人工标注[21]

5.1.1 标准配准测试图像对比实验1

通过分析标准配准测试图像,验证SGNMI算法在抗模糊和抗噪声方面的优势。为了保证实验的客观性,采用文献[ 21]中的Oldbuilding子集作为标准配准图像集,进行测度函数的对比实验。原因是该子集相比文献[ 21]中其他自然景观类的子集,在形态上更接近电力设备。首先,在标准配准数据集中随机选取一组图像对不同测度函数进行详细分析,如图5所示。将可见光图像作为参考图像,红外图像作为浮动图像,其中两图像已完全配准。计算浮动图像在不同位置下的归一化测度函数值,结果如图6所示,其中,HTD表示浮动图像的纵向平移距离,LTD表示浮动图像的横向平移距离。

图 5. 准配准数据集的实验样本。(a)可见光图像;(b)红外图像

Fig. 5. Experimental sample of standard registration data set. (a) Visible image; (b) infrared image

下载图片 查看所有图片

图6中可以发现,当横向和纵向的平移距离均为0时,两个图像完全配准,此时的相似性测度函数一般达到最大(1)。图6(a1)~图6(c1)是测试图像的实验结果,可以发现,SGNMI的主峰最突出,有利于在求解最优配准参数时得到全局最优解。GWW-NMI算法的主峰也比较尖锐,但是与周围局部峰的对比度较小。而SMI算法的主峰不尖锐,这表明其对配准细节的灵敏度较低。图6(a2)~图6(c2)是在原图基础上增加系数为6的椒盐噪声的实验结果,图6(a3)~图6(c3)是在原图基础上增加系数为6的高斯噪声的实验结果。可以发现,SGNMI算法的结果基本没有明显的变化,原因是SGNMI算法增加了显著性区域的对比度,具有良好的抗噪声和抗模糊能力。GWW-NMI算法的实验结果显示其局部峰更加明显,即全局最优解和局部最优解之间的对比度较小,容易导致配准优化算法陷入局部最优解。SMI算法的实验结果与GWW-NMI算法类似,受噪声和图像模糊的影响较大。

图6对单一图像进行分析,从侧面反映了SGNMI算法的抗模糊性和抗噪性较好。为了直观体现不同算法对红外图像模糊程度的适应情况,对比了不同模糊程度下配准参数的MAE和RMSE。选取标准配准数据集中除图5外剩余50组红外和可见光图像进行配准实验[21]。所有的标准测试图像均为完全配准图像对,部分图像如图7所示。

图 6. 不同算法的结果对比。(a) SMI; (b) GWW-NMI; (c) SGNMI

Fig. 6. Comparison results of different algorithms. (a) SMI; (b) GWW-NMI; (c) SGNMI

下载图片 查看所有图片

图 7. 部分标准配准的测试图像。(a)可见光图像;(b)红外图像

Fig. 7. Part of the standard registration test image set. (a) Visible image; (b) infrared image

下载图片 查看所有图片

通过表1表2中设置的配准参数,计算50组样本在不同模糊程度下配准参数的平均MAE和RMSE,结果如图8所示。可以发现,随着高斯模糊中滤波器标准差σ的增加,红外图像的模糊程度不断增大,配准难度增加。而SGNMI算法因注重显著性区域边缘并提高了图像的对比度,因此,对图像模糊的适应性最好,与图6中的实验结果相吻合。GWW-NMI算法更适合边缘信息较为丰富的图像,当红外图像的边界较为模糊时,难以通过滑动窗口提取有效的梯度信息,配准效果较差。而SMI算法为基于图像灰度强度的互信息配准,当边缘信息模糊时,图像不同区域之间的强度过渡更加缓和,容易造成误配准。

图 8. 模糊图像的测试结果。(a) MAE; (b) RMSE

Fig. 8. Test results of blurred images. (a) MAE; (b) RMSE

下载图片 查看所有图片

5.1.2 标准配准测试图像对比实验2

为了反映SGNMI算法在标准配准数据集中的配准精度和配准时间,利用5.1.1小节中的50组图像进行测度函数的对比实验。通过CPSO算法优化三种测度函数下(13)式中的4个配准参数,每组图像配准20次,图7对应的实验结果如表3所示,其中,1~4分别为对应的四组配准图像。标准配准数据集中50组图像的平均MAE、平均RMSE和平均配准时间如表4所示。

表 3. 标准测试图像集的配准结果

Table 3. Registration result of standard test image set

SampleMAERMSERegistration time /s
GWW-NMISMISGNMIGWW-NMISMISGNMIGWW-NMISMISGNMI
10.8971.4350.9311.2132.2411.3910.7344.2311.032
21.2931.6921.1251.4792.6931.5920.8233.3281.143
30.7361.6130.9620.9862.8611.2420.6724.0541.097
41.0431.9730.9471.4353.1731.3740.7434.4260.969

查看所有表

表 4. 50组标准测试图像集的配准结果平均值

Table 4. Mean value of registration results of 50 sets of standard test image sets

Mean MAEMean RMSEMean registration time /s
GWW-NMISMISGNMIGWW-NMISMISGNMIGWW-NMISMISGNMI
1.0101.6731.0401.3872.4901.3240.9263.8471.239

查看所有表

表3表4中可以发现,SMI算法用时较长,且配准效果较差。SGNMI算法相比于SMI算法所用的时间较少,效果更优。GWW-NMI算法和SGNMI算法均是利用图像中的强梯度进行配准,因此,两种算法的配准精度相近。由于本算法使用了基于流形排序的显著性检测,所以相比GWW-NMI算法配准时间较长。这表明SGNMI算法在牺牲一定时间的基础上,提高了配准算法对红外图像模糊的适应性。

5.1.3 实际数据集对比实验3

为了验证SGNMI算法在实际电力巡检中的应用效果,建立实际数据集进行对比。样本取自于某变电站,使用CMOS图像传感器(Sony IMX214)采集可见光图像,采用增强型热成像相机(Therm-App TH)采集红外图像。红外摄像机的参数如表5所示。

表 5. 红外相机的参数

Table 5. Parameters of infrared camera

ParameterValue
Resolution /pixel×pixel384×288
Scene temperature range /℃0--200
Temperature accuracy /%±2
Wavelength /μm7--13
Focus range /m>0.6
Frame rate /Hz8.7

查看所有表

图像采集时间为2019年11月19日15时,温度为5 ℃,天气阴,PM2.5为193。共采集50组红外和可见光图像作为实验样本,部分实验样本如图9所示。

图 9. 可见光图像集和红外图像集。(a)可见光图像;(b)红外图像

Fig. 9. Visible image set and infrared image set. (a) Visible image; (b) infrared image

下载图片 查看所有图片

按照标准配准数据集的标注格式进行人工标注,为每组红外和可见光图像标记10对匹配点[21]。用CPSO算法优化三种测度函数下的配准参数,每组样本图像配准20次,得到图10中三个测度函数各自的平均配准精度和平均配准时间。图10中的标记点“6”和“40”表示配准失败的两个样本。可以明显发现,SMI算法的配准时间较长,SGNMI算法的配准时间大于GWW-NMI算法,原因是SGNMI算法引入显著性检测导致配准时间稍长。而SMI算法的MAE和RMSE明显高于其他两种算法。实际数据集的结果与标准测试图像集的结果基本一致,这表明GWW-NMI算法虽然在配准效果上和SGNMI算法相近,且配准时间上有一定优势。但SGNMI算法侧重于人为增强红外图像中的显著性区域梯度,当红外图像出现模糊时,配准效果更好。

图 10. 实际数据集的测试结果。(a)配准时间; (b) MAE; (c) RMSE

Fig. 10. Test results of the actual data set. (a) Registration time; (b) MAE; (c) RMSE

下载图片 查看所有图片

5.2 优化算法对比实验

为验证CWPA的有效性,采用CPSO算法[20]、CWPA和WPA参数优化算法进行对比实验。其中CPSO算法和WPA均为智能种群算法,在图像配准中的效果较好[20]

5.2.1 标准测试函数对比实验

为了更好地覆盖不同类型的测试函数,选取包含单峰(U)/多峰(M)和低维(L)/高维(H)在内的8个测试函数,对比不同算法的寻优能力。选取的典型测试函数如表6所示。

由于不同文献对智能进化算法进行有效性测试时采用的测试参数有差别,采用参考文献中提供的最优参数设置算法中的其他参数[14-20]。用上述三种优化算法,按照表2设置的参数对标准测试函数进行20次独立实验,按照文献[ 22]中的评价指标,得到的结果如表7所示,其中,MEAN为进化计算结束时的目标函数均值,STD为目标函数标准差,SR为寻优成功率,ε为单次计算得到的最佳目标函数与全局最优目标函数差的绝对值,ε<10-6表示寻优成功。SR为寻优成功次数和实验总次数的比值,AEN为平均寻优成功进化数,寻优成功进化数表示算法进化过程中首次达到寻优成功标准时的迭代次数。

表 6. 标准测试函数

Table 6. Standard test functions

FunctionExpressionFeatureSolution spaceGlobal extremum
Spheref1=i=1Dxi2L/U[-10,10]20
Sumsquaresf2=i=1Dixi2L/U[-10,10]1000
Boothf3=(x1+2x2-7)2+(2x1+x2-5)2L/M[-10,10]20
Quadricf4=i=1Dk=1ixk2L/M[-30,30]1000
Powersumf5=i=1Dj=1Dxji-bi2H/U[-10,10]20
Zakharovf6=i=1Dxi2+i=1D0.5ixi2+i=1D0.5ixi4H/U[-10,10]1000
Griewankf7=14000i=1Dxi2-i=1Dcosxii+1H/M[-600,600]1000
Ackleyf8=-20exp-0.21Di=1Dxi2-exp1Di=1Dcos(2πxi)+20+eH/M[-32,32]1000

查看所有表

表 7. 优化算法的性能对比

Table 7. Performance comparison of optimization algorithms

FunctionAlgorithmMEANSTDSR /%AEN
SphereWPA6.31×10-918.13×10-87100111.30
CPSO7.8×10-1882.1×10-18510034.70
CWPA2.45×10-918.97×10-88100102.10
SumsquaresWPA2.16×10-968.57×10-9610088.46
CPSO1.03×10-81.05×10-810033.64
CWPA4.84×10-962.17×10-9510077.56
BoothWPA1.32×10-61.7×10-6100145.50
CPSO0010031.24
CWPA1.07×10-91.25×10-910087.42
QuadricWPA7.60×10-842.21×10-89100326.52
CPSO6.88×10+21.46×10+202000.00
CWPA6.82×10-903.12×10-90100226.60
PowersumWPA6.63×10-952.30×10-95100113.30
CPSO1.09×10-61.01×10-61001172.00
CWPA4.84×10-1831.27×10-18310038.42
ZakharovWPA3.18×10-22.98×10-1100391.80
CPSO1.202.2002000.00
CWPA4.15×10-162.06×10-16100237.98
GriewankWPA1.44×10-895.56×10-89100243.52
CPSO1.03×10+32.97×10+202000.00
CWPA6.63×10-901.88×10-89100221.94
AckleyWPA9.33×10-11.1960991.04
CPSO9.37×10+11.3702000.00
CWPA4.62×10-103.29×10-12100193.51

查看所有表

为验证CWPA在实际电力巡检环境中的应用,利用5.1.3小节中的50组实际图像进行对比实验,用SGNMI作为统一的测度函数。CPSO算法、CWPA和WPA都是针对(13)式中的配准参数进行优化。首先,利用标注匹配点求出标准配准参数{Hi,Vi,Qi,Ri}(i=1,2,…,50),Hi,Vi,Qi,Ri分别为标准水平方向位移H、标准竖直方向位移V,标准图像旋转角度Q,标准缩小率R。其次,用目标配准误差(TRE)作为评价指标[23],可表示为

σTRE=H-hH2+V-vV2+Q-qQ2+R-rR2(26)

(26)式综合反映了配准参数h(水平平移量)、v(竖直平移量)、q(放缩率)和r(旋转角度)在优化过程中与理想值的差值,进而反映优化算法的配准精度。对每组图像配准20次,得到平均配准时间和平均σTRE,如图11所示。其中,配准时间为满足ΔσTRE≤10-3时的计算时间。可以发现,WPA在样本6、33和40上的σTRE异常高,CPSO算法在样本6和样本40上的σTRE异常高。这表明配准优化算法在这几个样本上无法实现配准优化。但在其他样本中,WPA、CWPA和CPSO算法的最终配准精度相近。在图11(b)中,WPA的计算时间较长,但在样本6、33和40上的配准时间异常少,这表明WPA在这三组样本的配准过程中陷入了局部最优解,过早地停止收敛。同样CPSO算法在样本6上,也过早地停止收敛。但在样本40中,CPSO算法直到达到最大收敛步数,即iter=2000时,也未完全收敛。原因是图11中的样本6和样本40分别为图9(a2)、图9(b2)和图9(a3)、图9(b3),其中图9(b2)和图9(b3)的背景较为复杂,由SGNMI提取的梯度信息较多,导致在配准优化中的局部极值增加,不利于配准优化算法。

图 11. 实际数据集的实验结果。(a) σTRE;(b)配准时间

Fig. 11. Experimental results of actual data set. (a) σTRE; (b) registration time

下载图片 查看所有图片

综上所述,实际图像数据集的实验结果(图11)与标准测试数据集的实验结果(表7)相吻合。且表7中WPA的AEN在各类函数中均高于CWPA,因此WPA的配准时间远高于CWPA。由于CWPA中用(18)式对局部最优解进行检测,使CWPA在自建图像集和标准测试函数中的寻优成功率均高于WPA。CPSO算法在表7中高维多峰函数上的表现明显比CWPA差,且在图11中CPSO算法的配准成功率低于CWPA。但当三种算法都实现配准时,配准精度相差不大。这表明CWPA在图像配准这类高维多峰函数时的配准成功率和配准效率更高,更适合红外和可见光图像配准。

6 结论

为了提高巡检机器人在电力巡检过程中对红外和可见光图像的配准效果,将红外图像中显著梯度信息和可见光图像的梯度信息进行对比,并结合传统归一化互信息,建立了新的SGNMI测度函数。实验结果表明,SGNMI算法在牺牲一定配准时间的情况下,可提高对红外图像模糊程度的适应性。同时,结合了文化算法的双层进化机制和狼群算法,解决了狼群算法中探狼搜索方式单一和猛狼围攻半径固化等问题。在标准测试函数的对比实验中,CWPA相比于WPA有更好的收敛速度和收敛性;相比于CPSO算法,CWPA虽然在单峰函数中寻优能力较弱,但在多峰函数中具有更好的全局寻优能力。在实际红外和可见光图像配准中,CWPA表现出更高的收敛性和配准率。本算法为电力巡检机器人的红外与可见光图像配准提供了精度保证,有利于后续电力设备的故障定位和故障识别。鉴于图像配准的最终目的是提升红外和可见光图像的融合质量,后续研究还需结合图像融合算法,对本算法进行更全面的评价。

参考文献

[1] Li Y, Yu F Y, Cai Q, et al. Image fusion of fault detection in power system based on deep learning[J]. Cluster Computing, 2019, 22(4): 9435-9443.

[2] 李巍, 董明利, 吕乃光, 等. 基于T分布混合模型的多光谱人脸图像配准[J]. 光学学报, 2019, 39(7): 0710001.

    Li W, Dong M L, Lü N G, et al. Multispectral face image registration based on T-distribution mixture model[J]. Acta Optica Sinica, 2019, 39(7): 0710001.

[3] 朱明, 姚强, 唐俊, 等. 超图约束和改进归一化互相关方法相结合的图像配准算法[J]. 国防科技大学学报, 2019, 41(3): 50-55.

    Zhu M, Yao Q, Tang J, et al. Image registration algorithm with hypergraph constraint and improved normalized cross correlation method[J]. Journal of National University of Defense Technology, 2019, 41(3): 50-55.

[4] 陈龙, 张峰峰, 于凌涛, 等. 归一化互信息与多分辨率融合的2D-3D配准方法[J]. 哈尔滨工程大学学报, 2020, 41(2): 243-249.

    Chen L, Zhang F F, Yu L T, et al. A 2D-3D registration method based on normalized mutual information and multi-resolution fusion[J]. Journal of Harbin Engineering University, 2020, 41(2): 243-249.

[5] Abdel-Basset M, Fakhry A E, El-Henawy I, et al. Feature and intensity based medical image registration using particle swarm optimization[J]. Journal of Medical Systems, 2017, 41(12): 197.

[6] 闫利, 王紫琦, 叶志云. 顾及灰度和梯度信息的多模态影像配准算法[J]. 测绘学报, 2018, 47(1): 71-81.

    Yan L, Wang Z Q, Ye Z Y. Multimodal image registration algorithm considering grayscale and gradient information[J]. Acta Geodaetica et Cartographica Sinica, 2018, 47(1): 71-81.

[7] Yang T J, Tang Q, Li L, et al. Nonrigid registration of medical image based on adaptive local structure tensor and normalized mutual information[J]. Journal of Applied Clinical Medical Physics, 2019, 20(6): 99-110.

[8] 刘小燕, 王皓浩, 孙刚, 等. 基于互信息的荧光素眼底血管造影图像序列的自动配准方法[J]. 电子与信息学报, 2018( 8): 1919- 1926.

    Liu XY, Wang HH, SunG, et al. A novel automatic registration method for fluorescein fundus angiography sequences based on mutual information[J]. Journal of Electronics & Information Technology, 2018( 8): 1919- 1926.

[9] Yu K, Ma J, Hu F Y, et al. A grayscale weight with window algorithm for infrared and visible image registration[J]. Infrared Physics & Technology, 2019, 99: 178-186.

[10] Wang C J, Goatman K, Boardman J P, et al. Distance oriented particle swarm optimizer for brain image registration[J]. IEEE Access, 2019, 7: 56016-56027.

[11] Liu J, Li Y, Wang W B, et al. Automatic, high-accuracy image registration in confocal microscopy[J]. Applied Optics, 2017, 56(32): 8924-8930.

[12] Pradhan S, Patra D. RMI based non-rigid image registration using BF-QPSO optimization and P-spline[J]. AEU-International Journal of Electronics and Communications, 2015, 69(3): 609-621.

[13] Chen C L, Jian B L. Infrared thermal facial image sequence registration analysis and verification[J]. Infrared Physics & Technology, 2015, 69: 1-6.

[14] Wu H S, Zhang F M. Wolf pack algorithm for unconstrained global optimization[J]. Mathematical Problems in Engineering, 2014, 2014: 1-17.

[15] Chen XY, Tang CJ, WangJ, et al. and Systems, 2018, E101. D( 7): 1946- 1949.

[16] Yan X S, Song T, Wu Q H. An improved cultural algorithm and its application in image matching[J]. Multimedia Tools and Applications, 2017, 76(13): 14951-14968.

[17] Zhu X Z, Tang C, Wang P C, et al. Saliency detection via affinity graph learning and weighted manifold ranking[J]. Neurocomputing, 2018, 312: 239-250.

[18] 薛晗, 邵哲平, 潘家财, 等. 基于文化萤火虫算法的足球机器人动态路径规划[J]. 控制与决策, 2018, 33(11): 2015-2020.

    Xue H, Shao Z P, Pan J C, et al. Cultural firefly algorithm for dynamic path planning of soccer robot[J]. Control and Decision, 2018, 33(11): 2015-2020.

[19] Liang J Y, Liu X P, Huang K N, et al. Automatic registration of multisensor images using an integrated spatial and mutual information (SMI) metric[J]. IEEE Transactions on Geoscience and Remote Sensing, 2014, 52(1): 603-615.

[20] Guo Y N, Yang Z, Wang C, et al. Cultural particle swarm optimization algorithms for uncertain multi-objective problems with interval parameters[J]. Natural Computing, 2017, 16(4): 527-548.

[21] MatthewB, SabineS. Multi-spectral SIFT for scene category recognition[C]∥International Conference on Computer Vision and Pattern Recognition (CVPR11), June 20-25, 2011, Colorado Springs, CO, USA. New York: IEEE, 2011: 177- 184.

[22] 薛俊杰, 王瑛, 李浩, 等. 一种狼群智能算法及收敛性分析[J]. 控制与决策, 2016, 31(12): 2131-2139.

    Xue J J, Wang Y, Li H, et al. A smart wolf pack algorithm and its convergence analysis[J]. Control and Decision, 2016, 31(12): 2131-2139.

[23] Öfverstedt J, Lindblad J, Sladoje N. Fast and robust symmetric image registration based on distances combining intensity and spatial information[J]. IEEE Transactions on Image Processing, 2019, 28(7): 3584-3597.

赵洪山, 张则言. 基于文化狼群算法的电力设备红外和可见光图像配准[J]. 光学学报, 2020, 40(16): 1610003. Hongshan Zhao, Zeyan Zhang. Power Equipment Infrared and Visible Images Registration Based on Cultural Wolf Pack Algorithm[J]. Acta Optica Sinica, 2020, 40(16): 1610003.

本文已被 2 篇论文引用
被引统计数据来源于中国光学期刊网
引用该论文: TXT   |   EndNote

相关论文

加载中...

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!