基于自然场景统计的色域映射图像无参考质量评价 下载: 888次
1 引言
随着跨媒体复制、高保真印刷的应用日益广泛,数字彩色图像通常需要在不同设备之间进行传输和再现,从而促进了色域映射技术的发展。人们已经提出了大量的色域映射算法[1-3],但在色域映射过程中,不可避免地会引入色调偏移、信息丢失等各种失真,影响人对图像的视觉体验。图像质量是人们对图像视觉感受的主观评价,包含图像的逼真度和可读懂性。逼真度是指被评价图像与标准图像的偏离程度,偏差越小,逼真度越高;可读懂性是指图像向人或机器提供信息的能力。而色域映射会对图像质量造成不可忽视的影响,因此如何准确地评价色域映射图像的质量已经成为一个亟待解决的问题。
图像质量可采用主观和客观两种方法进行评价。主观评价由观察者根据自身感官对图像进行评价,这种方法准确可靠,但耗时长,且易受外界环境等诸多因素的影响。客观评价使用数理统计的方法对数字图像进行像素级分析,提取能够判定图像质量的特征(矩、熵)判定图像质量,这种方法有效避免了主观方法的缺陷,近些年受到了广泛关注。
根据是否使用参考信息,可将已有的图像客观质量评价算法分为全参考、半参考和无参考三类[4-6]。全参考和半参考算法是假设完全或部分使用参考图像信息[7-12],但在有些情况下参考信息并不存在,导致全参考和半参考算法在这些情况下并不适用。因此,无参考算法受到极大的关注[13-21]。
现有的评价算法中,无论是特征相似度(FSIM)[10]、梯度幅值相似性偏差(GMSD)[11]、结构相似性(SSIM)[12]等全参考算法,还是基于空间域自然场景统计的无参考(BRISQUE)[22]算法、使用自然场景对数导数统计的无参考质量评价(DESIQUE)[23]算法、基于自由能熵的无参考质量评价(NFERM)[24]等无参考算法,在评价模糊、噪声和压缩失真等常见失真方面均取得了很好的效果。但却不能有效评价色域映射图像的质量,原因是大多数图像质量评价算法主要在图像灰度域上提取特征而忽略图像的颜色信息。因此,设计评价色域映射图像质量的模型有重要意义。
Lissner等[25]提出了彩色图像差异(CID)算法,在LAB2000HL颜色空间中预测了两幅色域映射图像的感知差异。Lee等[26]提出了基于方向统计的颜色相似性指标(DSCSI),从三种颜色属性中提取局部颜色特征,因色调信息具有周期性,所以使用循环统计方法量化色调信息。这两种算法都属于全参考算法,在无参考信息的情况下并不适用。Lee等[27]提出了一种基于不变性描述符的无参考算法(IDEAL),用色调、饱和度、对角(opponent angle)和球面角(spherical angle)四个参数表征颜色失真。上述算法在评价色域映射图像质量上取得了一定的成功,但评价的准确性和单调一致性还有待进一步提升。
本文提出了一种基于自然场景统计(NSS)的色域映射图像无参考质量评价算法。首先,将图像转换到Spatial-CIELAB颜色空间以提取图像的亮度、彩度和色调三种颜色属性。其次,对亮度分量进行Log-Gabor滤波,在其频域上基于NSS提取灰度统计特征表征图像结构失真和对比度失真;在彩度和色调两个分量的空间域上基于NSS提取颜色统计特征表征颜色失真。随后将提取的特征和图像的主观分数一起输入后向传播神经网络[28]进行回归训练,得到质量评价模型。最后用训练好的模型评价图像质量,并在三个色域映射图像库上进行实验,结果表明,本算法在评价色域映射图像质量方面优于现有的无参考质量评价算法。
2 基于NSS的色域映射图像质量评价算法
由于失真会改变自然图像属性的统计分布特性,因此提取失真图像的统计特征构建质量评价模型。本算法的实现框架如
2.1 颜色空间转换
为了更好地逼近人类视觉系统(HVS)对颜色的感知,将失真图像从RGB(Red,Green,Blue)空间转换到Spatial-CIELAB空间[29],获取图像的颜色三属性,且避免了三个属性间的交叉污染[25]。在Spatial-CIELAB颜色空间中,图像的每个像素包括L、a和b三个通道,L为亮度通道,a和b分别为两个颜色通道。Spatial-CIELAB空间的圆柱型表示模型定义了L、C、H三种颜色属性,能很好地逼近人类辨别颜色的方式[24]。可用a通道和b通道导出C分量和H分量表示Spatial-CIELAB的圆柱形模型
式中,a为深绿色到灰色再到亮粉红色这条颜色轴上的颜色值,b为亮蓝色到灰色再到黄色这条颜色轴上的颜色值。
图 2. 原始图像和质量逐渐降低的色域映射图像。(a)原始图像;(b)色域映射图像1;(c)色域映射图像2; (d)色域映射图像3
Fig. 2. Original image and gamut mapping images with decreasing quality. (a) Original image; (b) gamut mapping image1; (c) gamut mapping image2; (d) gamut mapping image3
2.2 特征提取
2.2.1 灰度特征提取
研究表明,HVS中的神经元在感知视觉场景时表现出方向和频率选择机制[30],因此提取多频率、多方向的统计特征有助于进行更好的图像质量评价。Gabor滤波器的频率和方向特征与HVS中的简单皮层细胞表现极其相似[31]。基于此,用图像亮度分量频域上提取的NSS特征表征图像的对比度失真和结构失真。实验用具有对数变换的Log-Gabor滤波器[23],以便更真实地反映自然图像的频率。Log-Gabor滤波器可表示为
式中,ῶ为径向频率(radial frequency),θ为滤波方向,θj=jπ/J,j={0,1,…,J-1}为方向角度,J为方向角度的个数,ω0为滤波器的中心频率,σγ为控制滤波器的径向带宽,σθ为决定滤波器的角度带宽。
1) Log-Gabor滤波后的频域矩和熵统计
色域压缩是色域映射过程中的常用操作,因此大多数色域映图像中会存在对比度失真。Fang等[32]证明了用图像矩(一阶矩:均值(mean),二阶矩:标准差(standard deviation))和熵(entropy)评价图像对比度失真是十分有效的。实验表明,失真会导致图像Log-Gabor系数的矩和熵发生明显变化。
图 3. 图像频域矩和熵随频率的变化。(a)图像频域熵随频率的变化;(b)图像频域均值随频率的变化;(c)图像频域标准差随频率的变化
Fig. 3. Changes in the frequency domain moment and entropy of the image with frequency. (a) Change of image frequency domain entropy with frequency; (b) change of image frequency domain mean with frequency; (c) change of image frequency domain standard deviation with frequency
2) Log-Gabor滤波后的频域分布直方图统计
对图像进行Log-Gabor滤波后得到图像的Log-Gabor系数g(i,j),其对数可表示为
式中,(i,j)为像素的空间坐标,K为一个常数,避免g(i,j)=0。
由文献[ 23]可知,原始图像Log-Gabor系数的对数统计分布模型符合高斯分布,而失真会破坏这种分布。因此用广义高斯分布(GGD)拟合Log-Gabor系数的对数统计模型,GGD的密度函数可表示为
式中,t为积分变量,x为函数变量,α为形状参数,σ为函数标准差。参数(α,σ)可以作为预测图像质量评价的有效特征。同样选择4个径向频率,2个方向,考虑到HVS的多层次特性,对图像进行下采样后再提取特征,共提取32个灰度统计特征。
2.2.2 颜色特征
对于图像的彩度分量sC(i,j),其4个方向的相邻像素差值系数可表示为
式中,HC(i,j)为水平方向相邻像素的差值系数,VC(i,j)为垂直方向相邻像素的差值系数,
对图像的色调分量sH(i,j),其4个方向的相邻像素差值系数可表示为
因彩色图像的色调是一个可循环的角度值,取值范围为[0,2π)[21]。由文献[
27]可知,原始图像的色调分量相邻像素差值系数服从柯西分布,而色调失真会改变这种分布。
由
式中,x为函数变量,ε为位置参数,ρ为尺度参数。可用参数(ε,ρ)作为评价颜色信息的有效特征,选择4个方向的相邻像素差值系数,考虑到HVS的多层次特性,对图像进行下采样后再提取特征,共提取16个颜色统计特征。
由
2.3 模型训练
对于一幅失真图像,共提取104个质量感知特征,包括56个灰度特征,48个颜色特征,作为色域映射图像的特征矢量。用AdaBoosting BPNN训练质量评价模型[28],然后用该模型评价色域映射图像的质量。AdaBoosting算法基于初始化权值ω,用弱学习算法得到强预测函数,经多次计算误差率调整权值ω得到强预测函数。BPNN是最基础的神经网络,属于有监督学习,能模仿人类的神经元激活、传递过程,包含一个输入层(input layer)、两个隐藏层(hidden layer)和一个输出层(output layer)。BPNN的输入维度与每幅图像的特征矢量维度相同,输出的是图像的质量分数。AdaBoosting BPNN的结构如
图 7. AdaBoosting BPNN的结构。(a) AdaBoosting算法的结构;(b) BPNN的结构
Fig. 7. Structure of the AdaBoosting BPNN; (a) Structure of the AdaBoosting algorithm; (b) structure of BPNN
3 实验结果和分析
3.1 实验设置
在三个公开的色域映射图像数据库上验证本算法的性能,包括Basic Study(BS)、Image Gamut(IG)和Local Contrast(LC)[34]。分别有97、65和72幅原始图像以及1067、520和576幅色域映射图像。主观实验在相同环境中由测试者同时观察相同内容的原始图像和两幅色域映射图像,选择与原始图像更相似的1幅色域映射图像,并记录结果。然后借助Thurstone数学模型[35]将主观实验数据转换为每幅失真图像的MOS,数据库的具体信息如
表 1. 色域映射图像质量评价数据库
Table 1. Gamut mapping image quality evaluation databases
|
用4个性能参数作为实验的评价指标,包括皮尔森线性相关系数(PLCC)、斯皮尔曼相关系数(SRCC)、肯德尔系数(KRCC)和均方根误差(RMSE)。PLCC和RMSE描述客观算法预测值与MOS之间的相关性,衡量客观算法的预测准确性;SRCC和KRCC衡量客观算法预测的单调一致性。PLCC、SRCC和KRCC越大,RMSE越小,表示该算法的评价性能越好。
1) 皮尔森线性相关系数
式中,si为每幅图像的MOS,
2) 斯皮尔曼相关系数
式中,rsi和rxi分别为si和xi在各自数据序列中的排序位置,N为实验图像的数量。
3) 肯德尔等级相关系数
式中,Nc为数据序列中序号对一致的个数,Nd为序号对不一致的个数。
4) 均方根误差
式中,si为每幅图像的MOS,fi为每幅图像的客观分数。
由于各类评价算法的客观质量的取值范围与MOS的取值范围不一致,因此采用单调逻辑拟合函数将图像的客观质量值映射到与MOS相同的尺度空间上。
式中,y为MOS,f(y)为拟合后的分数,其中αi{i=1,2,3,4,5}为拟合回归参数。
3.2 性能比较
将本算法与常用的9个无参考质量评价算法进行比较,包括BRISQUE[22]、盲图像质量指标(BIQI)[36]、DESIQUE[23]、基于真实性和完整性的图像质量评价算法(DIIVINE) [37]、NFERM[24]、基于离散余弦变换的盲图像完整性指标(BLLINDS-II)[38]、自然图像质量评价模型(NIQE) [39]、基于局部统计的自然图像质量评价算法(IL_NIQE) [40]、IDEAL[27]。其中IDEAL和IL_NIQE两种算法考虑了颜色信息,其余算法都是基于灰度信息的,除NIQE和IL_NIQE算法外,其余算法都是基于训练的算法。将数据库中的图像分成不重叠的两部分,一部分包含80%的图像作为训练集,剩余20%的图像作为测试集。为了保证结果的准确性,重复1000次实验,取4个性能指标结果的中值,结果如
表 2. 不同算法在三个数据库中的性能对比
Table 2. Performance comparison of different algorithms in three databases
|
从
3.3 颜色特征对色域映射图像的重要性
本算法主要包含两组特征,一组是基于传统灰度域提取的灰度特征,一组是基于彩度和色调提取的颜色特征。为了验证颜色特征对本算法性能的提升,将两组特征分别用于模型训练和质量预测,结果如
图 8. 灰度特征和颜色特征的性能对比。(a) BS数据库;(b)IG数据库;(c) LC数据库
Fig. 8. Performance comparison of grayscale features and color features. (a) BS database; (b) IG database; (c) LC database
3.4 颜色分量峰值特征对色域映射图像的重要性
本算法在提取颜色特征时将彩度和色调分量相邻差值系数的统计峰值作为特征。为验证峰值特征对算法性能的提升,去掉本算法使用的特征矢量中16个峰值特征,对剩余的88维特征矢量进行模型训练和质量预测。再将预测结果与原算法预测结果进行对比,结果如
图 9. 峰值特征对算法性能的影响。(a) BS数据库;(b) IG数据库;(c) LC数据库
Fig. 9. Influence of peak value features on algorithm performance. (a) BS database; (b) IG database; (c) LC database
3.5 质量预测实例
为了直观地展示本算法对色域映射图像的预测效果,给出了4幅不同失真程度的色域映射图像,如
图 10. 色域映射图像实例。(a) MOS为0.6268;(b) MOS为0.5972;(c) MOS为0.2927;(d) MOS为0.1341
Fig. 10. Example of gamut mapping images. (a) MOS is 0.6268; (b) MOS is 0.5972; (c) MOS is 0.2927; (d) MOS is 0.1341
表 3. 不同算法的预测结果
Table 3. Predicted results by different algorithms
|
4 结论
分析了色域映射图像的失真特点及其HVS的多尺度特性,提取亮度分量的频域统计信息和颜色分量的空间域统计信息构成特征矢量。结合特征矢量与MOS,利用AdaBoosting BPNN算法训练色域映射图像无参考质量评价模型。利用亮度分量的频域矩和熵表征对比度失真,利用亮度分量的频域统计分布表征全局结构失真,结合颜色分量的空间域统计信息表征图像的颜色失真。实验结果表明,本算法在评价色域映射图像质量方面是有效的。
[1] Dugay F, Farup I, Hardeberg J Y. Perceptual evaluation of color gamut mapping algorithms[J]. Color Research and Application, 2008, 33(6): 470-476.
[2] KolasO, FarupI. Efficient hue-preserving and edge-preserving spatial color gamut mapping[C]// 15th Color Imaging Conference, November, 5-9, 2007, Albuquerque, NM, USA. New York: IEEE, 2007, 978: 207- 212.
[3] Farup I, Gatta C, Rizzi A. A multiscale framework for spatial gamut mapping[J]. IEEE Transactions on Image Processing, 2007, 16(10): 2423-2435.
[4] Zhou Y, Li L D, Wu J J, et al. Blind quality index for multiply distorted images using biorder structure degradation and nonlocal statistics[J]. IEEE Transactions on Multimedia, 2018, 20(11): 3019-3032.
[5] Zhou Y, Li L D, Wang S Q, et al. No-reference quality assessment for view synthesis using DoG-based edge statistics and texture naturalness[J]. IEEE Transactions on Image Processing, 2019, 28(9): 4566-4579.
[6] Chandler D M. Seven challenges in image quality assessment: past, present, and future research[J]. ISRN Signal Processing, 2013, 2013: 1-53.
[7] 薛小波, 郁梅, 何美伶. 基于仿视觉细胞模型的立体图像质量评价方法[J]. 激光与光电子学进展, 2016, 53(4): 041004.
[8] 张勇, 金伟其. 小波域结构相似度融合图像质量评价方法[J]. 中国激光, 2012, 39(6): 0109007.
Zhang Y, Jin W Q. Assessment method of fusion image quality in wavelet domain structural similarity[J]. Chinese Journal of Lasers, 2012, 39(6): 0109007.
[9] 熊义明, 邵枫, 孟祥超. 基于稀疏表示的失真卫星立体图像全参考质量评价[J]. 光学学报, 2018, 38(12): 1210002.
[12] Wang Z, Bovik A C, Sheikh H R, et al. Image quality assessment: from error visibility to structural similarity[J]. IEEE Transactions on Image Processing, 2004, 13(4): 600-612.
[13] 薛松, 张思雨, 刘永峰. 高光谱超分图像质量评价[J]. 激光与光电子学进展, 2019, 56(4): 041001.
[14] 黄姝钰, 桑庆兵. 基于图像融合的无参考立体图像质量评价[J]. 激光与光电子学进展, 2019, 56(7): 071004.
[15] 朱晓玲, 许妙忠, 丛铭. 基于支持向量机的无参考遥感图像质量评价方法[J]. 航天返回与遥感, 2014, 35(6): 83-90.
Zhu X L, Xu M Z, Cong M. Assessment method for no-reference remote sensing image quality based on support vector machine[J]. Spacecraft Recovery & Remote Sensing, 2014, 35(6): 83-90.
[16] 李一凡, 李朝锋, 桑庆兵. 四元数小波变换优化单目图的无参考立体图像质量评价[J]. 激光与光电子学进展, 2019, 56(18): 181006.
[17] Li L D, Lin W S, Wang X S, et al. No-reference image blur assessment based on discrete orthogonal moments[J]. IEEE Transactions on Cybernetics, 2016, 46(1): 39-50.
[18] Li L D, Wu D, Wu J J, et al. Image sharpness assessment by sparse representation[J]. IEEE Transactions on Multimedia, 2016, 18(6): 1085-1097.
[19] Li L D, Zhou Y, Gu K, et al. Quality assessment of DIBR-synthesized images by measuring local geometric distortions and global sharpness[J]. IEEE Transactions on Multimedia, 2018, 20(4): 914-926.
[20] Zhou Y, Li L D, Wang S Q, et al. No-reference quality assessment of DIBR-synthesized videos by measuring temporal flickering[J]. Journal of Visual Communication and Image Representation, 2018, 55: 30-39.
[21] Zhou Y, Li L D, Zhu H C, et al. No-reference quality assessment for contrast-distorted images based on multifaceted statistical representation of structure[J]. Journal of Visual Communication and Image Representation, 2019, 60: 158-169.
[23] Zhang Y, Chandler D M. No-reference image quality assessment based on log-derivative statistics of natural scenes[J]. Journal of Electronic Imaging, 2013, 22(4): 043025.
[24] Gu K, Zhai G T, Yang X K, et al. Using free energy principle for blind image quality assessment[J]. IEEE Transactions on Multimedia, 2015, 17(1): 50-63.
[26] Lee D, Plataniotis K N. Towards a full-reference quality assessment for color images using directional statistics[J]. IEEE Transactions on Image Processing, 2015, 24(11): 3950-3965.
[27] Lee D, Plataniotis K N. Toward a No-reference image quality assessment using statistics of perceptual color descriptors[J]. IEEE Transactions on Image Processing, 2016, 25(8): 3875-3889.
[28] Liu L X, Hua Y, Zhao Q J, et al. Blind image quality assessment by relative gradient statistics and adaboosting neural network[J]. Signal Processing: Image Communication, 2016, 40: 1-15.
[29] Zhang X, Wandell B A. A spatial extension of CIELAB for digital color-image reproduction[J]. Journal of the Society for Information Display, 1997, 5(1): 61-63.
[30] Wu J J, Lin W S, Shi G M, et al. Visual orientation selectivity based structure description[J]. IEEE Transactions on Image Processing, 2015, 24(11): 4602-4613.
[31] Marĉelja S. Mathematical description of the responses of simple cortical cells[J]. Journal of the Optical Society of America, 1980, 70(11): 1297-1300.
[32] Fang Y M, Ma K D, Wang Z, et al. No-reference quality assessment of contrast-distorted images based on natural scene statistics[J]. IEEE Signal Processing Letters, 2015, 22(7): 838-842.
[33] Jupp P E, Batschelet E. Circular statistics in biology[J]. Biometrics, 1982, 38(3): 870.
[34] Bara czuk Z, Zolliker P, Giesen J. Image-individualized gamut mapping algorithms[J]. Journal of Imaging Science and Technology, 2010, 54(3): 030201.
[35] Thurstone L L. A law of comparative judgment[J]. Psychological Review, 1927, 34(4): 273-286.
[36] Moorthy A K, Bovik A C. A two-step framework for constructing blind image quality indices[J]. IEEE Signal Processing Letters, 2010, 17(5): 513-516.
[40] Zhang L, Zhang L, Bovik A C. A feature-enriched completely blind image quality evaluator[J]. IEEE Transactions on Image Processing, 2015, 24(8): 2579-2591.
Article Outline
余伟, 徐晶晶, 刘玉英, 张俊升, 李腾腾. 基于自然场景统计的色域映射图像无参考质量评价[J]. 激光与光电子学进展, 2020, 57(14): 141006. Wei Yu, Jingjing Xu, Yuying Liu, Junsheng Zhang, Tengteng Li. No-Reference Quality Evaluation for Gamut Mapping Images Based on Natural Scene Statistics[J]. Laser & Optoelectronics Progress, 2020, 57(14): 141006.