作者单位
摘要
重庆邮电大学通信与信息工程学院,重庆 400065
跨模态行人重识别是一项具有挑战性的行人检索任务。现有研究侧重于通过提取模态共享特征来减小模态间差异,忽视了对模态内差异和背景干扰的处理。为此,提出了一种掩膜重构与动态注意力(MRDA)网络,该网络通过重构人体区域特征来消除背景杂波的影响,从而增强网络对背景变化的鲁棒性。此外,该网络结合了动态注意力机制,以过滤无关信息,动态挖掘并增强具有辨别力的特征表示,消除模态内差异的影响。实验结果显示:该网络在SYSU-MM01数据集的all-search模式下的第一个检索结果匹配成功的概率(Rank-1)和均值平均精度(mAP)分别达到70.55%和63.89%;在RegDB数据集的visible-to-infrared检索模式下的Rank-1和mAP分别达到91.80%和82.08%。在公共数据集上验证了所提方法的有效性。
行人重识别 跨模态 掩膜重构 双流网络 动态注意力 
激光与光电子学进展
2024, 61(10): 1015001
作者单位
摘要
1 东南大学, 南京 210000
2 西安电子科技大学, 西安 710000
针对传统视频异常事件检测算法准确率低、鲁棒性差等问题, 提出了一种基于双流残差网络的视频异常事件检测算法。该算法综合运用深层残差网络、时序分割网络以及卷积融合策略。在传统双流网络利用单帧图像和多帧光流图像分别提取运动信息和时序行为的基础上, 进一步加深网络深度, 扩展运动信息建模能力; 同时,利用分段构建网络的方式充分提取时序特征, 提升对长时间视频处理效果; 并且将高维时空特征进行融合, 充分挖掘视频中的时空关联关系, 得到最终检测结果。在公开的UCF-Crime和XD-Violence数据集上训练和验证的实验结果表明, 提出的基于双流残差网络的视频异常事件检测算法相较于仅使用单模态网络(空间流网络)的方法准确率提升约10%, 与传统双流网络相比, 准确率也分别提升3.2%和6.1%。
视频异常事件检测 多模态特征融合 残差网络 双流网络 video anomaly event detection multi-modal feature fusion residual network two-stream network  
电光与控制
2022, 29(8): 88
作者单位
摘要
1 信阳职业技术学院数学与计算机科学学院,河南 信阳 464000
2 信阳农林学院信息工程学院,河南信阳 464000
3 中国人民解放军空军第一航空学院研究生大队,河南 信阳 464000
为了提升复杂背景下红外序列的行人动作识别精度,本文提出了一种改进的空时双流网络,该网络首先采用深度差分网络代替时间信息网络,提高时空特征的表征能力与提取效率;然后,采用基于决策级特征融合机制的代价函数对模型进行训练,可以更大限度地保留不同网络帧间图像的时空特征,更加真实地反映行人的动作类别。仿真结果表明,本文提出的改进网络在自建的红外视频数据集上获得了81%的识别精度,且计算效率也提升了25%,具有较高的工程应用价值。
双流网络 红外序列 动作识别 光流图像 差分网络 深度学习 空时特征 two-stream network, infrared sequences, action rec 
红外技术
2021, 43(9): 852
作者单位
摘要
南通大学电气工程学院, 江苏 南通 226019
由于传统的视觉里程计(VO)存在实现过程繁琐、计算复杂等问题,提出了一种基于改进双流网络结构的VO。所提VO使用双流卷积神经网络结构,能够将RGB图像、深度图像同时馈入模型进行训练,并采用Inception网络结构对卷积层进行改进,减少参数数量。同时,在卷积层中加入注意力机制,提升网络对图像特征的辨识度和系统的鲁棒性。为了评估所提模型,在KITTI数据集上进行了模型的训练与测试,并与VISO2-M、VISO2-S和SfMLearner进行对比。结果表明,相较于同样使用单目相机的VISO2-M和SfMLearner,所提模型在旋转误差和平移误差方面取得了较大的改善,可与使用双目相机的VISO2-S相媲美。
图像处理 成像系统 视觉里程计 注意力机制 深度学习 双流网络 
激光与光电子学进展
2021, 58(20): 2010006
作者单位
摘要
中国民航大学 电子信息与自动化学院,天津300300
针对传统双流网络无法捕捉视频序列中的时序关系从而导致对时序依赖较大的行为识别效果不理想的问题,提出一种基于改进双流时空网络的人体行为识别算法。首先利用时间移位思想,使卷积神经网络对视频中的时序关系建模,从而高效地捕捉视频中的时空信息;同时使用注意力机制改善由于通道信息在时间轴上移动导致的空间特征学习能力下降的问题;在此基础上构建了一个包含时空表观信息流和时空运动信息流的双流网络结构;最后,采用加权平均的方式融合双流网络,得到最终的识别结果。在UCF101和HMDB51数据集上分别进行了实验,识别准确率为96.3%和77.7%,实验结果表明,与传统双流网络方法相比,识别准确率得到了一定的提升,验证了本文算法能够有效捕捉视频中的时序关系,增强网络的特征表达能力,提高对时序依赖较大的行为和近似行为的辨识能力。
计算机视觉 行为识别 双流网络 时间移位 注意力机制 computer vision action recognition two-stream convolution networks temporal shift attention mechanism 
光学 精密工程
2021, 29(2): 420
作者单位
摘要
江南大学江苏省模式识别与计算智能工程实验室, 江苏 无锡 214122
针对传统的双流网络不能有效提取视频序列中的有效帧和帧中的有效区域,而导致识别准确率低的问题,提出了一种基于时空交互注意力模型(STIAM)的人体行为识别算法。首先,利用两个不同的深度学习网络分别提取空间和时间特征;其次,设计一种掩模引导的空间注意力模型,用于计算每一帧上的显著性位置;然后,设计一种光流引导的时间注意力模型,用于定位每个视频中的显著性帧;最后,分别将时间、空间注意力获得的权重与空间特征、时间特征进行加权融合,使模型实现时空交互性。在UCF101和Penn Action数据集上与现有的方法进行比较,实验结果表明,STIAM具有较好的特征提取能力,可以明显提升行为识别的精度。
机器视觉 行为识别 双流网络 注意力 深度学习 交互性 
激光与光电子学进展
2020, 57(18): 181506
作者单位
摘要
宁波大学信息科学与工程学院, 浙江 宁波 315211
对视网膜血管形态特征的分析有助于视网膜相关疾病的诊断。为了能够更准确地分割出视网膜血管,提出一种基于双流网络的分割视网膜血管的方法。首先用具有编码器-解码器结构的卷积神经网络分别对整个血管和细血管进行分割;再将所得到的两个预测图进行融合,对融合后的图像去除伪影和噪声,得到最终的血管分割图。由于单独对细血管进行了分割,因此所提方法可以更有效地分割出一些难以识别的视网膜血管边缘和低对比度区域的细血管像素。实验结果表明,所提方法在DRIVE、STARE和CHASE_DB1三个数据库上的灵敏度分别达到0.8062、0.8308和0.8135,在性能上比其他方法更优。
图像处理 视网膜 双流网络 血管分割 卷积神经网络 
光学学报
2020, 40(4): 0410002

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!