作者单位
摘要
陕西科技大学 电子信息与人工智能学院,陕西 西安 710021
针对高光谱图像数据分布不均匀、空谱特征提取不够充分以及随着网络层数增加而导致的网络退化等问题,提出一种基于多尺度混合卷积网络的高光谱图像分类方法。首先,使用主成分分析对高光谱数据进行降维处理;接着,利用邻域提取将邻域内的像素点作为一个样本,补充相应的空间信息;然后,使用多尺度混合卷积网络对预处理后的样本数据进行特征提取,并加入混合域注意力机制来加强空间和光谱维中有用的信息;最后,使用Softmax分类器对每个像素样本进行类别划分。实验结果表明:将所提出的模型在Indian Pines和Pavia University两个高光谱数据集中进行实验,其总体分类精度、平均分类精度、Kappa系数分别能达到0.987 9、0.983 3、0.986 2和0.999 0、0.996 9、0.998 6。该算法能够更加充分地提取高光谱图像的特征信息,与其他分类方法相比取得了更好的分类效果。
高光谱图像 混合卷积网络 多尺度特征 注意力机制 hyperspectral image hybrid convolutional network multi-scale features attention mechanism 
液晶与显示
2023, 38(3): 368
张磊 1,2韩广良 1,*
作者单位
摘要
1 中国科学院 长春光学精密机械与物理研究所,吉林 长春 130033
2 中国科学院大学,北京 100049
针对基于人体骨架序列的动作识别存在的特征提取不充分、不全面及识别准确率不高的问题,本文提出了基于多分支特征和多尺度时空特征的动作识别模型。首先,利用多种算法的结合对原始数据进行了特征增强;其次,将多分支的特征输入形式改进为多分支的融合特征信息并分别输入到网络中,经过一定深度的网络模块后融合在一起;然后,构建多尺度的时空卷积模块作为网络的基本模块,用来提取多尺度的时空特征;最后,构建整体网络模型输出动作类别。实验结果表明,在NTU RGB-D 60数据集的两种划分标准Cross-subject和Cross-view上的识别准确率分别为89.6%和95.1%,在NTU RGB-D 120数据集的两种划分标准Cross-subject和Cross-setup上的识别准确率分别为84.1%和86.0%。与其他算法相对比,本文算法提取到了更为多样化、多尺度的动作特征,动作类别的识别准确率有一定的提升。
动作识别 多尺度特征 多分支特征 特征融合 action recognition multi-scale features multi-branch features feature fusion 
液晶与显示
2022, 37(12): 1614
马梁 1,2,3苟于涛 1,2,3雷涛 1,2,*靳雷 1,2宋怡萱 1,2,3
作者单位
摘要
1 中国科学院光电探测技术研究室,四川 成都 610209
2 中国科学院光电技术研究所,四川 成都 610209
3 中国科学院大学,北京 100049
本文提出了一种鲁棒的基于多尺度特征融合的遥感图像小目标检测方法。考虑到常用的特征提取网络参数量庞大,过多的下采样可能导致小目标消失,同时基于自然图像的预训练模型直接应用到遥感图像中可能存在特征鸿沟。因此,根据数据集中所有目标尺寸的分布情况(即:先验知识),首先提出了一种基于动态选择机制的轻量化特征提取模块,它允许每个神经元依据目标的不同尺度自适应地分配用于检测的感受野大小并快速从头训练模型。其次,不同尺度特征所反应的信息量各不相同且各有侧重,因此提出了基于自适应特征加权融合的FPN (feature pyramid networks)模块,它利用分组卷积的方式对所有特征通道分组且组间互不影响,从而增加图像特征表达的准确性。另外,深度学习需要大量数据驱动,由于遥感小目标数据集匮乏,自建了一个遥感飞机小目标数据集,并对DOTA数据集中的飞机和小汽车目标做处理,使其尺寸分布满足小目标检测的任务。实验结果表明,与大多数主流检测方法对比,本文方法在DOTA和自建数据集上取得了更好的结果。

多尺度特征 小目标检测 特征融合 场景复杂度 multi-scale features small object detection feature fusion scene complexity 
光电工程
2022, 49(4): 210363
作者单位
摘要
上海理工大学 光电信息与计算机工程学院,上海 200093
多聚焦图像融合技术是为了突破传统相机景深的限制,将焦点不同的多幅图像合成一幅全聚焦图像,以获得更加全面的信息。以往基于空间域和基于变换域的方法,需要手动进行活动水平的测量和融合规则的设计,较为复杂。所提出的方法与传统的神经网络相比增加了提取浅层特征信息的部分,提高了分类准确率。将源图像输入训练好的多尺度特征网络中获得初始焦点图,然后对焦点图进行后处理,最后使用逐像素加权平均规则获得全聚焦融合图像。实验结果表明,本文方法融合而成的全聚焦图像清晰度高,保有细节丰富且失真度小,主、客观评价结果均优于其他方法。
多聚焦图像融合 卷积神经网络 多尺度特征 multi-focus image fusion convolutional neural network multi-scale features 
光学仪器
2021, 43(5): 40
作者单位
摘要
上海工程技术大学电子电气工程学院, 上海 201620
为了解决单幅图像的去雾问题,提出一种新型端到端的网络,该网络利用改进的多尺度特征循环生成对抗网络。不同于以往的模型,所提的网络不依赖于传统的大气散射模型,并且在训练的过程中不需要对应匹配图像,大大简化了训练过程。接着设计一种新型的多尺度生成器,采用双通道融合的特征金字塔结构来最大程度地提取图像中的特征,同时引入多个全局和局部的鉴别器来改善网络性能与图像质量。实验结果表明,所提的模型在不同的数据集上都可以取得很好的结果。
图像处理 图像去雾 生成对抗网络 多尺度特征 局部鉴别器 
激光与光电子学进展
2021, 58(16): 1610024
作者单位
摘要
淮北师范大学计算机科学与技术学院, 安徽 淮北 235000
韦伯局部描述子(WLD)是一种有效的图像特征描述子。但是,构成WLD特征的差分激励和梯度方向无法准确地刻画掌纹图像的局部灰度变化和纹线的方向,因此基于WLD的掌纹识别性能并不高。针对掌纹图像纹线特征较丰富的特点,对WLD特征进行改进获得多尺度Gabor方向韦伯局部描述子,以提高掌纹识别的性能。首先,采用多尺度Gabor滤波器对掌纹图像进行滤波,得到多尺度能量图和方向图;然后,基于能量图计算差分激励;最后,基于多尺度差分激励图和方向图构造直方图特征,并将不同尺度下的特征向量串联,进而生成掌纹图像的最终特征集。在PolyU,PolyU Multi-spectral和CASIA三种数据库上的实验结果表明,本文方法与一些现有的掌纹识别方法相比,具有较高的识别率和较低的等错误率。
模式识别 掌纹识别 韦伯局部描述子 Gabor方向 多尺度特征 
激光与光电子学进展
2021, 58(16): 1610018
作者单位
摘要
成都理工大学信息科学与技术学院(网络安全学院), 四川 成都 610051
近几年虽然基于神经网络的超分辨率重建技术发展迅速,但仍然存在不易找到合适尺寸的卷积核、网络层数过深导致收敛缓慢等缺点。为此,提出了一种能多尺度提取特征并包含多重残差的网络模型。低分辨率图像输入网络,通过多个多尺度残差模块,在每个模块进行多尺度特征提取、特征融合,构建残差输出到下一个模块,通过所有模块后再次构建残差,最终经过亚像素卷积输出高分辨率图像。实验结果表明,多重残差的引入使学习的收敛速度更快,多尺度能更好地提取图像特征,使图像在主观和客观度量上都优于其他主流算法。
图像处理 超分辨率 神经网络 多尺度特征 多重残差网络 
激光与光电子学进展
2020, 57(18): 181009
作者单位
摘要
1 空军工程大学信息与导航学院, 陕西 西安 710077
2 东北电力大学理学院, 吉林 吉林 132000
针对复杂场景下激光雷达测量(LiDAR)点云数据的地物分类问题,提出了一种基于多尺度特征和PointNet的深度神经网络模型,该方法改进了PointNet提取局部特征的能力,实现了复杂场景下LiDAR点云的自动分类。在PointNet网络基础上添加多尺度网络提取点的局部特征,将不同尺度点的局部特征通过全连接层组成一个多维特征,并与PointNet提取的全局特征相结合,返回每个点类的分数以完成点云分类标签。利用Semantic 三维数据集和ISPRS提供的Vaihingen数据集,验证了所提深度神经网络模型。研究结果表明,与其他用于点云分类的神经网络相比,所提算法达到了更高的分类精度。
遥感 激光雷达测量 点云分类 多尺度特征 PointNet 
激光与光电子学进展
2019, 56(5): 052804
作者单位
摘要
1 合肥工业大学电子科学与应用物理学院, 安徽 合肥 230009
2 合肥工业大学特种显示技术国家工程实验室现代显示技术省部共建国家重点实验室光电技术研究院, 安徽 合肥 230009
3 合肥工业大学仪器科学与光电工程学院, 安徽 合肥 230009
提出了一种基于多尺度递归网络的图像超分辨率网络模型,该模型主要由多个多尺度特征映射单元级联而成,每个单元分别包含一组不同尺度的特征提取层、一个融合层以及一个特征映射层。特征提取直接在原始低分辨率图像上进行,最后采用亚像素卷积重构高分辨率图像。训练阶段使用自适应矩估计优化方法加速网络模型的收敛。实验结果表明,所提算法取得了较好的超分辨率结果,图像纹理清晰、边缘锐利,视觉效果明显得到增强。在Set5、Set14、BSD100以及Urban100等常用测试集上的客观评价指标(PSNR和SSIM)均高于现有的几种主流算法。
图像处理 超分辨率 多尺度特征 卷积神经网络 亚像素卷积 
光学学报
2019, 39(6): 0610001
作者单位
摘要
1 华东理工大学信息科学与工程学院,上海 200237
2 东华大学信息科学与技术学院,上海 201620
对车载红外图像进行深度估计,可应用于车辆的夜间辅助驾驶系统(Driver Assistant Systems,DAS),本文提出了一种新型的神经网络结构来估计红外图像的深度。受景物分类思想的启发,将传统深度估计方法中的回归问题转化为分类问题。首先,对红外图像进行归一化预处理,并将深度图置于自然对数空间对距离进行远近分类。其次,设计了一种新型的金字塔输入残差神经网络(PyramidResidual Neural Networks, PRN),将红外图像以金字塔型结构作为网络输入,网络结构分为粗略特征提取和精细特征提取两部分。最后,将全连接层改为全卷积层,大大减少了网络中的参数个数,降低计算复杂度。金字塔型结构的输入使得网络能够多尺度提取特征,这使得估计出的深度图场景中的对象轮廓比同一网络单一红外图像输入估计出的景物轮廓更清晰。此外,通过计算错误和准确性评价指标,证明本文的提出方法能够很好地估计红外图像的深度,对比实验验证了本文方法更具优势。
深度估计 车载红外图像 金字塔型输入 残差网络 多尺度特征 depth estimation vehicle infrared images pyramid input residual networks multi-scale features 
红外技术
2018, 40(5): 417

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!