作者单位
摘要
内蒙古农业大学计算机与信息工程学院, 内蒙古 呼和浩特 010018
近年来, 基于深度学习的模型在高光谱图像(HSI)分类方面效果显著。 针对小样本数据基于深度学习的高光谱图像分类方法分类精度不高的问题, 提出一种融合卷积长短期记忆(ConvLSTM)和多注意力机制网络的高光谱图像分类方法。 该方法分三个分支: 光谱分支、 空间X分支和空间Y分支分别提取光谱特征、 空间X特征和空间Y特征, 并将三个方向的特征融合进行高光谱图像分类。 由于ConvLSTM在学习有价值的特征和对光谱数据中的长期依赖关系建模方面表现出良好的性能, 所以在光谱分支中用了3个隐藏层、 卷积核大小为3×3、 通道分别为150、 100和60提取光谱信息。 在空间X分支和空间Y分支, 采用基于DenseNet和3D-CNN的Dense空间X块和Dense空间Y块分别提取空间X特征和空间Y特征。 为了增强特征提取, 在这三个分支中还分别引入了其特征方向的注意力机制, 针对信息丰富的光谱波段设计了光谱注意块, 信息丰富的像素点分别设计了空间X和空间Y注意块。 在三个公开的高光谱数据集上进行了实验, 即Indian Pines(IP)、 Pavia University(UP)和Salinas Valley(SV)数据集; 并对比了其他五种方法: 基于RBF径向核的支持向量机模型(SVM)、 更深更广的卷积神经网络模型(CDCNN)、 快速密集光谱-空间卷积网络模型(FDSSC)、 空谱残差网络模型(SSRN)、 双分支双注意力机制网络模型(DBDA)。 实验中, IP数据集上训练样本和验证样本的大小设为总样本的3%, UP和SV数据集上训练样本和验证样本的大小设为总样本的0.5%。 该方法和所有基于深度学习的方法, 批处理大小均设置为16, 优化器设为Adam, 学习率设置为0.000 5, 并动态调整学习率。 由于SVM直接利用光谱信息进行分类, 输入样本块像素大小为1×1, 其他基于深度学习方法的输入样本块像素均设置为9×9。 实验结果表明, 该方法能充分利用高光谱图像的光谱和空间特征, 在OA、 AA、 KAPPA等评价标准上均获得了更好的效果, 其中, 该方法的OA指标比次优的算法平均提高0.12%~2.04%。
高光谱图像分类 深度学习 卷积神经网络 注意力机制 Hyperspectral image classification Deep learning ConvLSTM ConvLSTM Convolutional neural network Attention mechanism 
光谱学与光谱分析
2023, 43(8): 2608
作者单位
摘要
1 中国科学院大学,北京 100049
2 中国科学院上海技术物理研究所 中国科学院红外探测与成像技术重点实验室,上海 200083
北极航道海冰运动的准确预测对于保证航行安全、评估航道可通行性和动态修正航线具有重要的指导意义。传统的光流法无法满足海冰运动预测任务中“时空预测+语义分割”的要求。为此,基于MERSI-Ⅱ影像制作了海冰运动数据集SeaiceMoving,提出了一种基于Multiloss-SAM-ConvLSTM的海冰运动预测算法,该算法在SAM-ConvLSTM的基础上引入加权的FDWloss,强化了各节点空间语义的获取。针对样本分布不平衡,讨论了后端分割阈值的偏移效应,通过网格搜索确定最佳分割阈值,提高了海冰整体预测结果。实验结果表明,该方法的Kappa系数为0.75,IOU为0.61,Dice系数为0.76,相较于SAM-ConvLSTM,分别提高了0.1、0.12和0.1,对运动后海冰的位置预测和形状提取能力均有提升,减少了海冰“黏连”的情况。此外,该算法对薄云干扰下的海冰运动依然具备良好的预测能力,可以为北极航线的动态规划和航线修正提供较为准确的技术支撑。
北极航道 风云三号卫星 独立海冰 Multiloss-SAM-ConvLSTM 运动预测 Arctic route FY-3 satellite independent sea ice Multiloss-SAM-ConvLSTM motion prediction 
红外与毫米波学报
2022, 41(5): 894
罗元 1,*李丹 1张毅 2
作者单位
摘要
1 重庆邮电大学光电工程学院, 重庆 400065
2 重庆邮电大学信息无障碍与服务机器人工程技术研究中心, 重庆 400065
手语识别广泛应用于聋哑人与正常人之间的交流中。针对手语识别任务中时空特征提取不充分而导致识别率低的问题, 提出了一种新颖的基于时空注意力的手语识别模型。首先提出了基于残差3D卷积网络(Residual 3D Convolutional Neural Network, Res3DCNN)的空间注意力模块, 用来自动关注空间中的显著区域; 随后提出了基于卷积长短时记忆网络(Convolutional Long Short-Term Memory, ConvLSTM)的时间注意力模块, 用来衡量视频帧的重要性。所提算法的关键在于在空间中关注显著区域, 并且在时间上自动选择关键帧。最后, 在CSL手语数据集上验证了算法的有效性。
手语识别 时空注意力 残差3D网络 卷积LSTM网络 sign language recognition spatial-temporal attention Res3DCNN ConvLSTM 
半导体光电
2020, 41(3): 414

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!