光电工程
2024, 50(12): 230218
作者单位
摘要
哈尔滨理工大学 测控技术与通信工程学院,黑龙江哈尔滨150080
为了解决传统深度卷积神经网络在舰船图像细粒度分类中的局限性,本文设计了细粒度遥感舰船开集识别模型。首先,引入了基于注意力机制的STN模块,加在特征提取网络前用来过滤背景信息;然后在STN模块后接一个多尺度的并行的卷积结构,强化网络对不同尺度的局部区域的特征提取能力;接着将提取到的特征分别输入基分支和元嵌入分支,用来增大类间方差和减小类内方差,同时强化模型对尾类小样本的学习;最后对两个分支的分类结果进行决策融合,根据设定的阈值判别已知类和未知类进一步对已知类进行细分。在平衡与不平衡分布的FGSCR-42数据集上进行了4种开放度实验,结果表明:在平衡分布的数据集上4种开放度的平均准确率为90.5%,86.3%,85.7%,85.1%,不平衡分布数据集的平均准确率为90.0%,85.1%,84.3%,84.1%。与当前主流的舰船识别方法相比,本文方法分类具有更高的识别准确率和更好的泛化能力。
注意力机制 细粒度分类 开集识别 决策融合 attention mechanism fine-grained classification open set recognition decision fusion 
光学 精密工程
2023, 31(24): 3618
作者单位
摘要
昆明理工大学 机电工程学院,云南 昆明 650000
视频实例分割是车辆辅助驾驶多目标感知和场景理解的一项关键技术。针对弱监督视频实例分割仅使用边界框对网络进行训练严重制约交通场景大尺度动态范围目标分割精度的问题,本文提出尺度自适应生成调控弱监督视频实例分割网络(Scale Adaptive Generation Regulation weakly supervised video instance segmentation network,SAGRNet)。首先,设计一种多尺度特征映射贡献度动态自适应调控模块,通过动态调整不同尺度特征映射信息贡献度取代原有的线性加权以强化对目标局部位置和整体轮廓的聚焦能力,解决了车辆、行人等目标由于成像距离远近造成的尺度动态范围过大问题;其次,构建目标实例多细粒度空间信息聚合生成调控模块,通过聚合基于不同空洞率提取的多细粒度空间信息生成权重参数以调控各尺度特征,实现了细化实例边界和增强跨通道信息交互掩码特征映射表征能力,有效弥补了实例边缘信息匮乏导致边缘轮廓分割mask连续性缺失问题。最后,为缓解边界框标签监督信息弱化,引入正交损失和颜色相似性损失缩小模型预测mask与真实边界框偏差并计算逐像素点对间标签属性归类模糊问题。Youtube-VIS2019提取的交通场景数据集实验结果表明,SAGRNet相较于弱监督基准网络平均分割精度提升5.1%达到38.1%,为实现多目标感知和实例级场景理解提供了有效算法依据。
辅助驾驶 弱监督 视频实例分割 自适应生成调控 细粒度 assisted driving weakly supervised video instance segmentation adaptive generation regulation fine grain 
光学 精密工程
2023, 31(18): 2736
作者单位
摘要
1 中国海洋大学信息科学与工程学部,山东 青岛 266100
2 青岛杰瑞工控技术有限公司,山东 青岛 266071
通过肉眼识别鱼类疫病依赖于诊断人员的经验,疫病数据存在类间差距较小与识别效率低等细粒度问题。由于Transformer缺乏卷积神经网络(CNN)的归纳偏差,需要大量的数据进行训练;CNN对全局特征提取不足,泛化性能较差等问题限制模型的分类精度。基于特征图对所有像素的全局交互建立算法模型,提出一种基于CNN与Vision Transformer相结合的鱼类疫病识别模型(CViT-FDRM)。首先,搭建鱼类疫病的数据库FishData01;其次,利用CNN提取鱼类图像细粒度特征,采用Transformer模型自注意力机制获取图像全局信息进行并行训练;然后,采用组归一化层将样本通道分组求均值与标准差;最后,采用404张鱼类疫病图像进行测试,CViT-FDRM达到97.02%的识别准确率。在细粒度图像开源数据库Oxford Flowers上的实验结果表明,CViT-FDRM的分类精度优于主流的细粒度图像分类算法,可达95.42%,提高4.84个百分点。CViT-FDRM在细粒度图像识别方面可达到较好的效果。
图像处理 卷积神经网络 Vision Transformer 细粒度 鱼类疫病识别 CViT-FDRM 
激光与光电子学进展
2023, 60(16): 1610005
作者单位
摘要
淮北师范大学物理与电子信息学院,安徽 淮北 235000
近年来,遥感图像场景在监测环境、勘探地球资源及预测自然灾害等方面有着越来越广泛的应用,大量的数据需求推动了遥感图像场景分类的快速发展。尽管基于深度学习的方法已经在场景分类方面取得了比较好的性能,但如何对背景复杂、尺度变化剧烈的遥感场景进行有效识别仍然是分类任务中的一个巨大挑战。为了解决这一问题,提出一种细粒度方法来检测显著区域,并使用全局分支和局部分支将整体和局部联合起来,分别从整幅图像和关键区域提取全局特征和局部关键信息。为了验证所提方法的有效性,基于ResNet18模型在三个公共遥感图像场景分类数据集上对不同方法进行对比实验,实验结果表明所提方法的准确率优于大多数先进方法。
深度学习 遥感 细粒度 显著区域检测 
激光与光电子学进展
2023, 60(4): 0428001
作者单位
摘要
云南大学信息学院,云南 昆明 650500
鉴别野生菌的种类是预防误食有毒野生菌的重要途径。因此,为了提高野生菌细粒度识别分类的准确率,对卷积模块的注意力机制模块(CBAM)进行改进,提出了一种并行相加卷积模块的注意力机制模块PA_CBAM,将CBAM中的通道注意力模块和空间注意力模块从原来的串行连接改为并行连接并相加,解决了2种注意力模块因串行连接带来的互相干扰问题。另外,参考特征金字塔的思想改进ResNet50,其Top-1和Top-5准确率达到86.03%和97.19%,较原来提升0.86和0.73个百分点;其添加PA_CBAM后在Top-1和Top-5准确率达到88.52%、97.58%,较CBAM模块提高了3.03和0.69个百分点。此外,为了将模型移植到移动端,结合迁移学习,提出了MobileNet_v2+PA_CBAM的识别方法,准确率达到94.87%,较之前提升0.66个百分点。研究表明:提出的注意力机制模块PA_CBAM在野生菌细粒度识别研究中具有更好的识别效果,具有一定的泛用性,并且MobileNet_v2+PA_CBAM训练后模型大小仅为27.8 MB,识别图片的平均耗时仅为1.3 ms,是在移动端部署野生菌识别的理想模型。
图像识别 细粒度分类 特征融合 注意力机制 迁移学习 
激光与光电子学进展
2023, 60(4): 0410004
作者单位
摘要
河北科技大学 信息科学与工程学院,河北石家庄050000
点云细粒度语义分割,即物体部件分割,在机械臂控制、智能化装配、物体检测等工业生产中有着重要的应用价值。然而由于点云数据形式散乱,导致物体部件边界处几何特征不明显且计算困难,从而致使细粒度分割精度较低,难以满足生产需求。针对点云的部件级分割,本文提出了增强点云局部显著性特征的细粒度语义分割网,网络中构建了局部数据上下文信息,提高细粒度分割精度。本网络建立了利用几何曲率改进的的最远点采样算法,增强点云局部数据子集特征计算能力;创建多尺度高维特征提取器,提取不同尺度的高维特征;在点云特征计算过程中使用seq2seq的方式,引入注意力机制,融合不同尺度的高维特征,进而获取细粒度语义分割的上下文信息。最终使得细粒度分割精度得到了有效提高,尤其是对边界处的分割效果提升显著。实验结果表明,本网络在ShapeNet Part数据集上的总体交并比达到了85.2%,准确率达到95.6%,且具有一定泛化能力。该方法对三维物体的细粒度语义分割具有重要的意义。
点云 细粒度分割 多尺度高维特征 注意力机制 几何特征 3D points cloud fine-grained segmentation multi-scale high-dimension Attention Mechanism geometric features 
光学 精密工程
2023, 31(2): 288
作者单位
摘要
宁夏大学信息工程学院,宁夏 银川 750021
细粒度图像具有不同子类间差异小、相同子类内差异大的特点。现有网络模型在处理过程中存在特征提取能力不足、特征表示冗余和归纳偏置能力弱等问题,因此提出一种改进的Transformer图像分类模型。首先,利用外部注意力取代原Transformer模型中的自注意力,通过捕获样本间相关性提升模型的特征提取能力;其次,引入特征选择模块筛选区分性特征,去除冗余信息,加强特征表示能力;最后,引入融合的多元损失,增强模型归纳偏置和区分不同子类、归并相同子类的能力。实验结果表明,所提方法在CUB-200-2011、Stanford Dogs和Stanford Cars三个细粒度图像数据集上的分类精度分别达89.8%、90.2%和94.7%,优于多个主流的细粒度图像分类方法,分类结果较好。
细粒度图像分类 Transformer 外部注意力 特征选择 多元损失 
激光与光电子学进展
2023, 60(2): 0210013
作者单位
摘要
1 泰州职业技术学院信息技术学院, 江苏泰州 225300
2 苏州大学计算机科学与技术学院, 江苏苏州 215006
针对现有热红外目标跟踪算法难以处理相似物干扰和目标遮挡的问题, 引入 MMNet(Multi-task Matching Network)算法中的多任务框架获取热红外目标特定的判别性特征和细粒度特征, 并将这两种特征相互融合, 用于在类间和类内识别热红外对象。此外, 利用峰值旁瓣比动态设置模型更新参数以更高效地获取目标变化信息并对跟踪结果进行评估。对于不可靠跟踪结果利用卡尔曼滤波对目标位置进行预测。在 LSOTB-TIR(Large-Scale Thermal Infrared Object Tracking Benchmark)红外数据集上的实验结果表明, 提出的改进算法性能较好, 相比 MMNet跟踪精确度和成功率分别提高了5.7%和4.2%, 且能有效应对遮挡、变形等挑战, 可以应用于红外目标跟踪领域。Based on Fusion of Discriminant and Fine-Grained Features
热红外 判别性特征 细粒度特征 峰值旁瓣比 卡尔曼滤波 thermal infrared discriminant features fine-grained features peak side lobe ratio kalman filter 
红外技术
2022, 44(11): 1139
作者单位
摘要
云南大学信息学院,云南 昆明 650500
鉴于国内野生菌中毒事件频发,拟采用深度学习技术来解决这一社会问题。但由于野生菌图像的类间差异较小,图像背景复杂,细粒度识别精度较低。针对这一问题,提出了一种改进的ResNeXt50网络。首先设计了一种多尺度特征引导(MSFG)模块,通过短连接引导网络充分学习和利用低级特征与高级特征;接着采用改进的注意力机制模块来减少网络对复杂背景的学习;最后对模型中的不同层级特征进行融合,利用得到的联合特征进行识别。实验结果表明,所提改进模型在测试集上的准确率可以达到96.47%,较未改进的ResNeXt50网络,在准确率上提升了2.64个百分点。对比结果显示,相较VGG19、DenseNet121、Inception_v3、ResNet50、ShuffleNet_v2这5个网络模型,所提改进模型在准确率上分别提升了8.10个百分点、5.13个百分点、3.24个百分点、3.30个百分点、4.25个百分点。
图像识别 细粒度 多尺度 特征引导 注意力机制 联合特征 
激光与光电子学进展
2022, 59(12): 1210016

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!