1 辽宁工程技术大学软件学院,辽宁 葫芦岛 125105
2 中国科学院福建物质结构研究所泉州装备制造研究中心,福建 泉州 362216
遥感影像场景分类方法多基于传统机器学习或卷积神经网络,此类方法的特征提取能力极为有限,尤其在处理类间相似度大、空间信息复杂、几何结构繁多的光学遥感影像时更容易出现特征信息丢失、分类精度受限等问题。基于此,提出一种融合字典学习与视觉转换器(ViT)的高分辨率遥感影像场景分类方法。该方法不仅能够挖掘图像内部的长距离依赖关系,而且可以利用字典学习抓取图像的深层非线性结构信息,从而达到提升分类准确度的目的。在PyTorch深度学习框架上,在RSSCN7、NWPU-RESISC45和Aerial Image Data Set(AID)3个公开的遥感影像数据集上对所提方法和模型进行了广泛实验,验证了所提方法的可行性,其分类正确率比原始视觉转换器模型分别高出1.763个百分点、1.321个百分点和3.704个百分点。与其他先进的场景分类方法相比,所提方法实现了更加优异的分类性能。
视觉转换器 字典学习 遥感场景分类 高分辨率遥感影像 激光与光电子学进展
2023, 60(14): 1410019
浙江大学光电科学与工程学院现代光学仪器国家重点实验室, 浙江 杭州 310027
由于场景的光谱信息受到不同照明条件的影响,故在照明不可控场景下拍摄的多光谱图像的光谱反射比重构需要进行照明光谱估计。因此,提出了一种基于单幅多光谱图像的通用方法来准确预测场景的照明光谱。首先,通过分析每个像素的响应特性设计并计算色度权重图,以寻找包含更多照明信息的像素。然后,对加权后的图像进行成分分析,以在通道域中提取光源响应特征。最后,得益于创新性引入的基于照明光谱库训练的字典学习方法,可估计出场景光源的相对光谱功率分布。所提方法在模拟数据和真实数据上的照明光谱估计平均角度误差分别为0.29和3.42,与现有的同类方法相比,表现出更优的准确性和鲁棒性。
颜色 多光谱成像 光源光谱估计 色度权重图 字典学习 光谱功率分布
华南理工大学物理与光电学院,广东 广州 510641
光场相机通过一次拍照可以同时记录场景的光线信息和方向信息,在三维场景的重建方面和先拍照后聚焦方面有非常广阔的应用前景,但是相比于普通相机,光场相机拍摄的照片清晰度不够。提出一种基于稀疏表示的光场图像超分辨率重建算法,该算法利用光场多视角图像之间的冗余信息对光场图像进行超分辨率重建。首先,选取光场多视角图像的中心图像作为待重建的低分辨率图像;然后,将其他视角的图像及其降采样图像作为字典训练样本,采用稀疏K-SVD方法进行训练,获得高、低分辨率字典对;最后,在图像重建过程中,采用改进的高斯Laplace算子提取低分辨率图像的特征。实验结果表明,所提改进方法可以恢复更多的图像细节并且大大加快了字典训练的速度。
图像处理 超分辨率 稀疏表示 字典学习 光场 激光与光电子学进展
2022, 59(2): 0210001
1 武汉大学印刷与包装系颜色科学实验室, 湖北 武汉 430079
2 武汉大学测绘遥感信息工程国家重点实验室, 湖北 武汉 430079
针对多光谱激光雷达系统在实景三维立体图像的真实颜色的再现问题,提出了一种基于稀疏信号表示的多光谱颜色数据降维方法,该方法利用字典学习和稀疏编码交替更新,以迭代的方式对光谱误差进行修正。实验结果表明,所提出的方法均方根误差的平均值较主成分分析法降低了35.29%,光谱拟合系数的平均值达到了99.8% 以上,色度精度也较主成分分析法平均提高了70.23%,在不同光源观测条件下仍能保持颜色的稳定性,其重构精度优于主成分分析法。该方法利用稀疏表示可以通过低维观测向量复原高维稀疏信号的特性,从数量相对较少的训练样本中对大量测试样本进行精确复原,提高了数据处理中的成本效率,对真实反映遥感多光谱影像的地物信息有较大的帮助。
光谱学 稀疏表示 字典学习 光谱反射率 光谱降维 激光与光电子学进展
2021, 58(22): 2230003
为了实现有效与可靠的视频传输,针对水下单光子通信系统,提出了一种基于字典学习和LT码级联LDPC码的视频联合编码方案。通过字典学习稀疏编码,极大地压缩了视频数据量。根据水下单光子信道存在的删除特性,利用LT码级联LDPC码的信道级联编码方法,同时克服了LT码译码开销过大的缺点。由于LT码存在译码失败概率的问题,提出了译码成功双反馈机制。实验结果表明,当信道误码率处于10-2数量级、视频压缩率为75.6%时,可以实现平均峰值信噪比(PSNR)为37.4921 dB重建视频帧。
水下单光子视频通信 字典学习 联合编码 LT编码 LDPC编码 underwater single-photon video communication dictionary learning joint coding LT coding LDPC coding
1 湘潭大学自动化与电子信息学院, 湖南 湘潭 411105
2 智能信息处理与应用湖南省重点实验室, 湖南 衡阳 421002
字典学习是图像表示的一种有效手段且在图像识别任务中具有出色的表现。大部分传统字典学习算法在多分辨率人脸图像识别中存在不同分辨率下字典判别性不强的问题。为了解决这一问题,提出一种新的带判别性局部结构约束的多分辨率字典学习算法。首先,通过分析字典原子与轮廓向量之间的一一对应关系,采用字典原子的局部几何结构,分别构造了轮廓向量的类内局部约束项与类间局部约束项;然后将这两个约束项统一在同一个正则项中,并将其增加到字典学习目标函数中进行联合优化,从而实现判别性局部几何结构的编码。该算法促使类内编码系数保持相似的局部一致性,而且能有效提高类间编码系数的局部结构的差异性。最后,在多个多分辨率人脸图像数据集上验证了本文算法的有效性,实验结果表明,与同类字典学习算法相比,本文学习的多分辨率字典能保持训练样本中的判别性局部结构,在不同分辨率的人脸图像上获得了更好的识别性能。
机器视觉 字典学习 判别性局部结构约束 多分辨率字典 人脸识别 激光与光电子学进展
2021, 58(14): 1415008
针对荧光扩散层析成像中荧光光源的定位误差较大和形态学信息不完整的问题,提出一种基于组稀疏正则化的同时代数重建技术(GSR-SART)算法。该算法利用图像的非局部自相似性和局部稀疏性构造自适应相似组;然后,将相似组作为基本单元,学习自适应字典;最后,采用迭代收缩阈值算法求解目标函数。实验结果表明,所提算法在峰值信噪比和方均根误差的结果上比其他先进算法有较大的提升。
成像系统 荧光扩散层析成像 非局部自相似性 稀疏表示 字典学习 激光与光电子学进展
2021, 58(2): 0211002
1 重庆大学机械传动国家重点实验室, 重庆 400044
2 重庆大学光电技术及系统教育部重点实验室, 重庆 400044
3 重庆大学工业CT无损检测教育部工程研究中心, 重庆 400044
4 重庆工商大学数学与统计学院, 重庆 400067
双能计算机断层扫描(DECT)技术因能分解和识别材料,并提供定量化的成像结果,广泛应用于医疗、安检、无损检测以及材料科学等领域。DECT技术能提供物体在两种能谱下的衰减信息,可准确分解两种基材料。但当检测对象含有三种材料时,若对DECT图像直接求逆(DIMD)分解多材料,其基图像将含较多噪声和伪影。为此,提出了一种基于双能CT图像域的字典学习(DL)和相对总变分(RTV)的多材料分解算法,简称DL-RTV算法。通过直接求逆获得初始基图像,利用字典学习挖掘基图像的稀疏性,以提高材料分解的准确性;引进RTV进一步降低基图像的噪声和伪影,并保护图像细节;同时引入各基材料质量守恒和像素边界的约束项,提高材料分解精度。仿真和实验研究表明,DL-RTV算法能较准确地分解三种材料,较好抑制基图像噪声和伪影,提高了材料区分度,从而验证了此算法的有效性和实用性,这对DECT技术的发展和应用具有重要的意义。
成像系统 双能计算机断层扫描技术 多材料分解 图像域 字典学习 相对总变分 光学学报
2020, 40(21): 2111004
中国矿业大学信息与控制工程学院, 江苏 徐州 221116
提出一种参数自适应的在线字典学习图像超分辨率重建算法。在经典的稀疏表示算法框架下,运用在线字典学习方法来提高字典学习的精度。通过参数自适应方法灵活调整稀疏重建阶段的正则化参数,并依据每个图像块的特点自适应确定正则化参数,以此克服人为设定参数的单一性和非最佳参数值的缺点。实验结果表明,与传统算法相比,所提算法可有效降低测试图像对训练图像集的依赖程度,同时克服图像在重建过程中存在的局部模糊或失真,进一步提高重建图像的质量。
机器视觉 图像重建 超分辨率 在线字典学习 正则化参数 自适应 激光与光电子学进展
2020, 57(6): 061505