1 重庆大学光电技术及系统教育部重点实验室ICT研究中心,重庆 400044
2 重庆大学工业CT无损检测教育部工程研究中心,重庆 400044
3 中国工程物理研究院化工材料研究所,四川 绵阳 621900
4 中国工程物理研究院激光聚变研究中心高温高密度等离子体物理实验室,四川 绵阳 621900
超快激光X射线单发照相技术具有高时空分辨能力,是观测高速运动物体形态参数如内部结构、平面性等的重要手段。但由于激光X射线脉宽在皮秒或飞秒量级、X射线能谱宽、成像环境复杂等原因,导致X射线图像背景干扰噪声大、对比度低,物体形态结构准确识别和测量难度大。在传统对比度限制直方图均衡化(CLAHE)图像增强算法的基础上,提出了一种多尺度融合的改进直方图均衡化(IHEMF)算法。该算法增加自适应裁剪阈值以适应每个区域特征,并利用亮度和梯度幅值信息将增强后图像与原始图像全局融合,最后对融合后图像去噪得到最终图像。该算法既能提高感兴趣区域的对比度噪声比(CNR),又具有很好的保边界特征的能力。对高速飞片的静态、动态、终态等典型状态下X射线图像进行处理,CNR分别提升50.97%、90.43%和96.84%。实验结果表明所提算法在噪声抑制和结构保真方面优于其他算法,可为准确解读高速运动物体形态表征参数信息提供重要技术支撑。
超快激光 X射线单发照相 图像增强 多尺度融合 直方图均衡化 中国激光
2023, 50(22): 2209001
1 桂林电子科技大学计算机与信息安全学院, 广西 桂林 541004
2 北京邮电大学人工智能学院, 北京 100876
3 北京邮电大学国际学院, 北京 100876
近红外光谱分析技术依赖于表征光谱向量和预测目标之间关系的化学计量学方法。 然而, 样品的光谱由信号和各种噪声组成, 传统化学计量学方法较难直接提取光谱的有效特征, 并为复杂的预测任务建立具有较强泛用性的校正模型。 进一步地, 受限于仪器间的差异, 在一台仪器上建立的模型应用于另一台仪器时, 难以取得相同的定量分析结果。 为此, 提出了一种基于卷积神经网络和迁移学习的定量分析建模及模型传递方案, 以提高模型在单仪器和跨仪器上的预测性能。 在卷积神经网络的基础上, 一种结合多尺度特征融合和残差结构, 名为MSRCNN的先进模型被设计, 并在主仪器上展现了卓越的预测能力。 然后, 设计了四种的基于fine-tune模型迁移策略, 将在主仪器上建立的MSRCNN模型迁移到从仪器。 在药品和小麦的公开数据集上的实验结果表明, MSRCNN在主仪器上的RMSE和R2分别为2.587, 0.981和0.309, 0.977, 优于PLS, SVM和CNN。 在利用30个从仪器的样本微调主仪器建立的模型后, 迁移MSRCNN中的卷积层和全连接层的方案取得了最好效果, 其RMSE和R2可分别达到2.289, 0.982和0.379, 0.965。 增加参与模型微调的从仪器样本, 可进一步提高性能。
近红外光谱 深度学习 迁移学习 多尺度融合 残差结构 模型传递 Near-infrared spectroscopy Deep learning Transfer learning Multi-scale fusion Residual convolution network Model transfer
1 江苏科技大学机械工程学院, 江苏 镇江 212003
2 江苏科技大学江苏省船海机械先进制造及工艺重点实验室, 江苏 镇江 212003
针对海洋复杂成像环境导致的水下图像出现颜色衰退、对比度低等问题, 提出一种改进的带色彩恢复的多尺度视网膜(Multi-Scale Retinex with Color Restore, MSRCR)与限制对比度自适应直方图均衡化(Contrast Limited Adaptive Histogram Equalization, CLAHE)多尺度融合的水下图像增强算法。首先, 采用带有导向滤波的 MSRCR算法解决水下图像颜色衰退的问题; 其次, 采用带有 Gamma校正的 CLAHE算法以提高水下图像的对比度; 最后, 对经过改进的 MSRCR和 CLAHE处理后的图像进行多尺度融合以获得细节增强后的水下图像。实验结果表明, 和其他算法相比, 文中算法的峰值信噪比(Peak Signal to Noise Ratio, PSNR)平均提高了 9.3914、结构相似性(Structural Similarity Index Measure, SSIM)平均提高了 0.3013、水下图像评价指标(Underwater Image Quality Evaluation, UIQE)平均提高了 4.7047, 能实现水下图像的有效增强。
水下图像增强 CLAHE增强 带颜色恢复的多尺度 Retinex 导向滤波 Gamma校正 多尺度融合 underwater image enhancement CLAHE enhancement MSRCR guided filtering Gamma correction multi-scale fusion
唐璐 1,1,2,2万良 1,1,2,">*王婷婷 1,1,2,2李树胜 1,1,2,2
1 贵州大学计算机科学与技术学院,贵州 贵阳 550025
2 贵州大学计算机软件与理论研究所,贵州 贵阳 550025
在图像的语义分割任务中,不同对象之间像素值存在差异,导致现有的网络模型在图像语义分割过程中丢失图像局部细节信息。针对上述问题,提出一种图像语义分割方法(DECANet)。首先,引入通道注意力网络模块,通过对所有通道的依赖关系进行建模提高网络的表达能力,选择性地学习并强化通道特征,提取有用信息,抑制无用信息。其次,利用改进的空洞空间金字塔池化(ASPP)结构,对提取到的图像卷积特征进行多尺度融合,减少图像细节信息丢失,且在权重参数不改变的情况下提取语义像素位置信息,加快模型的收敛速度。最后,DECANet在PASCAL VOC2012和Cityscapes数据集上的平均交并比分别达81.08%和76%,与现有的先进网络模型相比,检测性能更优,可以有效地捕获局部细节信息,减少图像语义像素分类错误。
图像语义分割 注意力机制 空洞空间金字塔池化 多尺度融合 激光与光电子学进展
2023, 60(4): 0410002
光子学报
2022, 51(11): 1110003
大多数基于深度学习的跨模态哈希方法直接通过神经网络学习不同模态数据的统一哈希码。这些方法忽略了单模态数据不同尺度包含不同语义信息这一影响数据特征表示的因素以及低维特征在弥合模态鸿沟上的重要性。基于上述问题,提出一种基于多尺度融合和投影匹配约束的跨模态哈希方法(MFPMC)。通过设计图像多尺度融合网络和文本多尺度融合网络来获取不同模态数据的低维特征,引入低维特征投影匹配约束和对抗训练来保证低维特征在模态间分布的一致性,同时用包含丰富语义信息的低维特征作为哈希函数的输入,进一步构建模态内哈希码损失、模态间哈希码损失、量化损失、标签嵌入损失来约束哈希函数及哈希码的学习,以此保证生成具有判别性的离散二进制哈希码。在MIRFlickr-25K和NUS-WIDE两个基准的跨模态检索数据集上的实验表明:所提方法比现有的几种哈希方法具有更好的检索性能。
跨模态哈希检索 多尺度融合 低维特征 投影匹配约束 激光与光电子学进展
2022, 59(24): 2410006
光学 精密工程
2022, 30(17): 2133
昆明理工大学机电工程学院,云南 昆明 650500
针对辅助驾驶中夜间小目标红外行人检测精度低、网络模型占用内存空间大、检测速度难以满足实时检测要求等问题,提出了一种轻量化的夜间红外图像行人检测神经网络YOLO-Person。首先提出一种以MobileNetV3轻量化网络为骨干网络,以多尺度融合目标检测层为预测模块的网络模型,以解决网络模型大、推理速度慢的问题,大幅减少了模型计算量,初步实现轻量化;然后通过在网络中添加空间金字塔池化模块与更小感受野的检测层,增强网络输出特征图的表征能力,解决数据集中行人目标尺度大小不均衡的问题,提高模型的红外行人检测精度;最后应用通道剪枝对模型进行剪枝,减少特征图的通道数,获得最终网络模型YOLO-Person。通过Jetson Nano移动开发平台,在夜间红外图像行人数据集上验证YOLO-Person轻量化模型,结果表明:与YOLOv3网络模型相比,提出的YOLO-Person网络模型更适于移动端的夜间红外行人检测,平均检测精度达到了92.2%,检测速度由26 frame/s提高到了69 frame/s,模型大小也由246 MB减少到了11.7 MB。
成像系统 夜间红外行人检测 多尺度融合 MobileNetV3网络 模型剪枝 中国激光
2022, 49(17): 1709002