基于自适应编辑距离的颜料光谱匹配识别方法 下载: 971次
1 引言
光谱匹配技术是通过将所测得的光谱反射率与光谱反射率数据库中已有的数据进行比较,求得2条曲线之间的相似性或者差异性的技术[1],该技术能精确地在光谱图像上进行像元识别。对壁画颜料物质进行无损检测的识别方法是利用颜料的光谱“指纹”特性[2-4],将壁画中待检测颜料的光谱反射率曲线与标准颜料光谱数据库中样本的光谱反射率曲线进行匹配,根据匹配结果的相似度来判断识别颜料的种类[5]。这种检测识别方法的关键是光谱匹配结果的精确度。
目前已有多种光谱匹配算法被用于解决实际问题,如:光谱数据编码匹配算法[6]、光谱角度匹配(SAM)算法[7]、光谱信息散度(SID)算法[8]、光谱相似度匹配(SCF)算法[9]等。由于壁画中相同色系不同颜料的物质的光谱反射率特性比较接近,因此上述算法在同色系不同物质光谱匹配时容易出现误匹配的情况。针对这一情况,本文将编辑距离(ED)算法引入到光谱匹配中,利用编辑距离对曲线数据差别更加敏感的优势,实现光谱反射率曲线数据的高精度匹配,从而来识别同色系不同颜料的物质;并针对颜料光谱反射率曲线在不同采集条件和不同浓度情况下仅幅值改变而形状不变的特点,改进编辑距离的匹配判定条件,通过自适应设定的差值阈值来减小匹配误差,进一步提高ED算法在壁画颜料物质光谱匹配识别时的精度。
2 光谱匹配方法
2.1 SAM算法
SAM法又称为光谱角度填图法[6]。设有2个
2.2 SID算法
SID法是一种基于信息论来衡量2条光谱之间差异的光谱识别方法。
2.3 SCF算法
SCF法是利用相关系数进行测度的方法,相关系数
式中:
通过随后的实验验证可知,上述3种算法在对同色系不同颜料物质的光谱进行匹配时,准确率较低,容易出现误匹配的情况,因此需要利用一种精度更高的算法进行光谱匹配。
3 ED算法
ED算法最初应用在字符串相似性衡量方面,通过计算2个字符串之间转化所需的最少的编辑操作数量,来衡量2个字符串之间的相似性[10]。
编辑距离的核心是利用动态规划来求解最优问题,用合适的递归方程把距离定义为代价函数。代价函数与相应的基本操作成本相关,每种基本操作的代价都是l。一般情况下,各基本操作的代价可以不同[11]。假设
基于代价方程,利用矩阵等辅助数据结构,使用动态规划算法建立自底向上的求解过程。计算长度为
利用表达式
其中
匹配关系矩阵右下角的元素
图 2. 不同采集条件下同种颜料的光谱反射率曲线
Fig. 2. Spectral reflectance curves of same pigment under different collection conditions
利用ED算法对
表 1. ED算法的匹配结果
Table 1. Matching results of ED algorithm
|
4 自适应编辑距离(ATED)算法
ED算法对不同状态下的同种颜料物质的光谱曲线进行匹配时会产生误判定,针对这一情况,本课题组对ED算法进行改进:1) 对光谱反射率数据进行归一化,将反射率数据的幅值全部限定在[0,1]区间,在不改变反射率曲线形状的情况下,将幅值归一到相同的区间内,以方便后续设置编辑距离的阈值。2) 利用自适应差值阈值替代零阈值作为新的判定条件,控制ED算法对曲线幅值的敏感反应程度。
4.1 光谱数据归一化
在获得光谱反射率数据后,对其进行归一化处理,使数据值都集中在[0,1]区间。对光谱向量
式中:min(
4.2 自适应阈值设定
通过设定自适应阈值的方式改变编辑距离的原始判定条件,控制ED算法在不同匹配情况下的敏感度。增加自适应阈值后的编辑距离判定条件为
式中:
集合
集合
由此可以计算出
当
ATED算法输出的结果与光谱反射率曲线采样点的个数相关,最终的值越接近0,说明2条曲线越相似。当2条曲线完全不相似时,返回的值为这2条曲线元素的个数。因此,ATED算法的匹配精度转换为百分比后的公式为
式中:
为了验证ATED算法匹配的准确率,分别利用ED算法和ATED算法对
表 2. ED算法和ATED算法的匹配结果
Table 2. Matching results using ED algorithm and ATED algorithm
|
考虑到不同的光谱分辨率可能会对匹配率精度造成影响,同时选取反射率
表 3. 不同光谱采样分辨率下ATED算法的匹配精度
Table 3. Matching accuracy of ATED algorithm at different spectral resolutions
|
5 结果分析及应用验证
5.1 实验数据
从颜料标准样本库中选取15种颜料进行测试,分别为白蛤(clammeal)、大红(dahong)、花青(indigo)、石绿(malachite)、石青(azurite)、曙红(blush)、藤黄(gamboge)、天蓝(azure)、胭脂(madder)、赭石(hematite)、朱膘(cinnabar)、铅丹(minium)、群青(ultramarine)、土红(laterite)、银朱(vermilion)。具体颜料如
采用分光光度计SpetroSuite测量每种颜料的光谱反射率数据,测量范围为400~900 nm,包括可见光至近红外范围。15种颜料的光谱反射率曲线如
5.2 算法准确率对比
光谱匹配算法的输出值并不统一,值域范围也不相同。为了更直观地比较各类算法的匹配结果,将SAM、SCF、SID、ATED算法的输出结果统一转化为百分数,以反映待测颜料与库中标准颜料的匹配率,值越接近100%,表示2种颜色是同一种物质的可能性越大。
SAM算法输出的区间为[0,π/2],将其输出转换为百分比的公式为
用1减去SAM算法计算出的2条光谱反射率曲线的广义夹角
SCF算法输出的区间为(-1,1),将其输出转换为百分比的公式为
先将整个输出的区间向右平移1个单位,同时把相关系数加1,再对这2个值求商,得到的值乘以100%,就可以得到最终的相似度。
SID算法最终输出的结果没有明确的范围,通过对已有的全部颜料的光谱反射率数据进行两两匹配可以看出,SID算法的取值都不会超过1。为了统一最终的输出结果,将SID算法输出的最大值设置为1,最终结果是越接近于0证明越相似,则转换为百分比的公式为
使用4种算法进行对比实验,选择的标准样本为标准颜料库中已有的石青、石绿、铅丹、白蛤、大红、花青、曙红、藤黄、天蓝、胭脂、赭石、朱膘12种颜料,进行同种颜料间的匹配,结果如
表 4. 4种算法光谱匹配结果
Table 4. Spectral matching results of four kinds of algorithms
|
5.3 同色系颜料匹配识别验证
中国古代颜料中的红色颜料有大红、铅丹、曙红、胭脂、赭石、朱膘、土红、银朱、深红等。古代壁画中常用的多为矿物颜料铅丹、赭石、银朱,这些颜料在颜色上相近,光谱反射率曲线也较相似,多为“S”型曲线,如
对同色系颜料的近似光谱曲线进行匹配时,为有效区分识别不同的颜料物质,需要使用高精度的光谱匹配算法。为了验证本文提出的ATED算法识别同色系颜料光谱反射率曲线的精度,选取6种红色颜料——大红、铅丹、曙红、胭脂、赭石、朱膘、土红进行实验,分别以大红、赭石、曙红作为待测样本,匹配结果分别如
表 5. 待测颜料大红的匹配结果
Table 5. Matching results of test pigment dahong
|
由
表 6. 待测颜料赭石的匹配结果
Table 6. Matching results of test pigment hematite
|
由
表 7. 待测颜料曙红的匹配结果
Table 7. Matching results of test pigment blush
|
由
通过上述3组实验可以看出,在处理同色系相似颜料光谱匹配问题时,SAM、SCF、SID算法都存在误匹配现象,而且在匹配正确时,ATED算法的匹配率比其他3种算法的匹配率更高,识别结果更精确。同时,ATED算法针对同种颜料在不同浓度和采集条件下光谱反射率曲线形状一致、幅值有差别的情况下也可以得到较好的匹配识别结果。
6 结论
本课题组研究了基于自适应阈值编辑距离的光谱匹配算法,基于ED算法的基本理论,结合壁画颜料光谱数据的特点,利用自适应设定数据差值的阈值方式对ED算法的判定条件进行改进,改进的判定条件能够克服基于编辑距离的光谱匹配算法对光谱数据幅值过于敏感的缺点。实验验证的结果表明,基于自适应阈值ED算法的光谱匹配率比传统SAM、SCF、SID算法的光谱匹配率有所提高,在壁画颜料的检测识别应用中取得了更好的识别效果。
[1] 杜小平, 刘浩, 陈杭, 等. 基于光度特性的卫星形状反演匹配算法研究[J]. 光学学报, 2016, 36(8): 0820001.
[2] 李文军, 王天一, 周宇, 等. 多层胶接结构胶层空气缺陷的太赫兹无损检测[J]. 光学学报, 2017, 37(1): 0111002.
[3] 杨珊珊, 米磊, 朱锐, 等. 光学相干断层成像技术在定窑瓷器检测中的应用[J]. 中国激光, 2016, 43(2): 0208002.
[4] 郑家文, 杨唐文. 基于拉曼光谱特征的生物组织识别方法[J]. 激光与光电子学进展, 2017, 54(5): 053001.
[5] 巩梦婷, 冯萍莉. 高光谱成像技术在中国画颜料分类和识别上的应用初探: 以光谱角填图(SAM)为例[J]. 文物保护与考古科学, 2014, 26(4): 76-83.
[6] 徐哲, 何明霞, 李鹏飞, 等. 光谱匹配算法应用于鸡血藤与大血藤的太赫兹光谱区分[J]. 光谱学与光谱分析, 2017, 37(1): 42-47.
[7] 胡滨, 何政伟, 张佳佳, 等. 多光谱数据矿化蚀变信息提取研究[J]. 地理空间信息, 2013, 11(4): 104-106.
[8] 王伟超, 王慧琴, 王可, 等. 一种基于统计流形的光谱信息散度颜料识别方法[J]. 激光与光电子学进展, 2018, 55(1): 013002.
[9] 郭彤, 华文深, 刘恂, 等. 一种基于高光谱的光学伪装效果综合评价方法[J]. 激光与光电子学进展, 2016, 53(10): 101002.
[10] 薛晔伟, 沈钧毅, 张云. 一种编辑距离算法及其在网页搜索中的应用[J]. 西安交通大学学报, 2008, 42(12): 1450-1454.
[11] 许君扬, 王慧琴, 吴萌, 等. 一种基于编辑距离的汉代画像石裂缝的检测算法[J]. 激光与光电子学进展, 2017, 54(8): 081006.
[12] 黄晓冬, 孙亮, 刘胜蓝. 一种判别极端学习的相关反馈图像检索方法[J]. 西安交通大学学报, 2016, 50(8): 96-102.
Article Outline
王可, 王慧琴, 殷颖, 毛力, 张毅. 基于自适应编辑距离的颜料光谱匹配识别方法[J]. 激光与光电子学进展, 2018, 55(11): 113004. Ke Wang, Huiqin Wang, Ying Yin, Li Mao, Yi Zhang. Pigment Spectral Matching Recognition Method Based on Adaptive Edit Distance[J]. Laser & Optoelectronics Progress, 2018, 55(11): 113004.