作者单位
摘要
四川大学电子信息学院,四川成都 610065
群组行为识别是对个体的共同行为进行识别。群组行为与群组状态密不可分,也与群组内个体时空特征息息相关,时空信息既能描述空间语义信息,更能反映行为的动态变化情况。针对有效精细的时空特征提取问题,本文提出了一种基于注意力机制和深度时空信息的群组行为识别方法。首先将 ShuffleAttention引入双流特征提取网络中,有效提取个体外观和运动信息。其次使用改进 Non-Local网络提取深度时序信息。最后将个体特征送到图卷积网络中进行空间交互信息建模,得到群组行为识别结果。在 CAD和 CAED数据集上的准确率达到了 93.6%和 97.8%,在 CAD数据集上与凝聚群组搜索算法(CCS)和成员关系图 (ARG)方法相比,准确率提高了 1.2%和 2.6%,这表明本文方法能有效提取深度时空特征,提升群组行为识别准确率。
群组行为识别 注意力机制 时空特征 交互关系 非局部网络 group activity recognition attention mechanism saptio-temporal information interactive relationships non-local network 
太赫兹科学与电子信息学报
2023, 21(5): 661
作者单位
摘要
四川大学电子信息学院, 四川 成都 610065
针对分布式视频编码(DVC)系统鲁棒传输问题, 设计了一种基于层修复的 DVC系统传输框架。该传输框架首先对关键帧 (K帧)同时采用高效视频编码 (HEVC)帧内编码和 Wyner-Ziv编码, 并将校验信息(Wyner-Ziv码流)作为修复层码流存入缓存中。若当前关键帧有丢失, 则向编码端请求该帧对应的层修复码流, 在解码端对错误块进行修复, 获得关键帧解码质量的提升。同时, 研究了层修复码率估计算法, 利用已成功解码的位平面辅助完成算法重建。实验结果表明, 该传输框架利用关键帧的层修复码流对关键帧失真部分进行了修复, 提高了关键帧质量, 改善了边信息质量, 实现了 DVC的鲁棒传输。
分布式视频编码 Wyner-Ziv编码 关键帧 鲁棒传输 修复层 Distributed Video Coding Wyner-Ziv video coding Key frame robust transmission repair layer 
太赫兹科学与电子信息学报
2023, 21(1): 82
作者单位
摘要
四川大学电子信息学院,四川 成都 610065
针对背景感知相关滤波器的空间正则化权重固定,不适应目标变化和增大搜索区域,易引入背景噪声导致滤波器判别力下降等问题,本文提出一种基于自适应空间正则化和畸变抑制的相关滤波跟踪算法。首先提取FHOG 特征、CN 特征和灰度特征以增强算法模型对目标的表达能力;其次,在目标函数中加入畸变抑制项来约束当前帧的响应图,增强滤波器的判别能力,以缓解滤波器模型退化问题;最后,在目标函数中加入自适应空间正则化项使空间正则化权重能够随着目标的变化而更新,使得滤波器能充分利用目标的多样性信息。本文在公开数据集OTB-2013、OTB-2015和VOT2016 上进行实验,以对所提算法进行评估。实验结果表明:本文算法速度为20 f/s,距离精度和成功率等评估指标均优于对比算法,在遮挡、背景干扰、旋转变化等多种复杂场景下都有良好的鲁棒性。
目标跟踪 相关滤波 畸变抑制 自适应空间正则化 object tracking correlation filter aberrance repression adaptive spatial regularization 
光电工程
2021, 48(1): 200068
作者单位
摘要
1 四川大学 电子信息学院, 四川 成都 610065
2 中国民航局第二研究所, 四川 成都 610000
夜间有雾环境中拍摄的图片具有光照不均、对比度低且模糊的现象。本文通过分析夜间有雾图像的成像特点, 提出一种有效的夜间图像去雾方法。首先, 在估计大气光时使用加权差分图像作为参考进行引导滤波来估计含轮廓信息的大气光; 使用拉普拉斯锐化灰度图像作为参考引导滤波来估计补充细节的大气光, 然后将算出的两种大气光融合得到最终的大气光。最后, 基于广泛使用的雾霾场景成像模型, 本文算法结合暗通道和亮通道构建了双通道联合优化的透射率函数, 在计算透射率的过程中加入了自适应权重系数、限制对比度自适应直方图均衡化和引导滤波来提高透射率函数的精度。实验结果表明, 在测试图片上计算的信息熵平均值为7.587 2, 对比度均值为23.809 7, 和对比算法相比均有一定提升。所提算法去雾结果视觉效果良好, 在去雾的同时可以有效减少细节的损失。
加权差分 拉普拉斯锐化 暗通道 亮通道 自适应权重系数Z weighted channel difference Laplace sharpening dark channel light channel adaptive weight coefficient 
液晶与显示
2021, 36(4): 596
作者单位
摘要
四川大学电子信息学院, 四川成都 610065
对公共空间中的多目标行人轨迹跟踪问题, 提出一种基于强化学习的多目标行人轨迹跟踪算法。首先采用高精确度的目标检测器检测公共空间视频中的行人目标, 并为每个目标分配一个独立的单目标跟踪器进行轨迹跟踪; 将每个目标作为独立智能体, 通过深度强化学习方式进行训练; 接下来结合跟踪轨迹与检测目标之间的表观和位置特征构建相似度代价矩阵; 最终通过匈牙利算法实现数据关联。实验表明, 在常用公开数据集上本文算法跟踪精确度达 76.1%, 表明算法对多目标轨迹跟踪的可行性与有效性。
轨迹跟踪 马尔科夫决策 强化学习 数据关联 trajectory tracking Markov decision reinforcement learning data association 
太赫兹科学与电子信息学报
2021, 19(2): 217
作者单位
摘要
四川大学电子信息学院,四川成都 610065
针对视觉问答 (VQA)任务中现存深度协同注意模型只考虑问题引导图像的单向注意方式,导致多模态学习交互性不足的问题,提出一种多模态双向导向注意力网络。该网络由多模态特征提取模块、双向导向注意力模块、特征融合模块以及分类器组成。将提取出的图像和问题特征分别经过层层注意后输出加权的注意特征;经过特征线性融合后送入 softmax分类器,得到问题的预测答案;再结合计数模块提升模型的计数能力。结果表明,该模型在公共数据集 VQA v2.0上表现良好,在 test_dev和 test_std测试子集上分别获得 70.77%、71.28 %的总体分类准确率,与大多数先进模型相比,体现出一定优势。
视觉问答 深度协同注意 单向注意 双向导向注意 特征融合 Visual Question Answering deep collaborativeattention unidirectional attention bidirectional guided attention feature fusion 
太赫兹科学与电子信息学报
2021, 19(1): 156
作者单位
摘要
1 四川大学电子信息学院,四川成都 610065
2 成都市规划设计研究院信息中心,四川成都 610065
城市用地功能分类的准确识别对精准把握城市现状、优化城市空间结构有重要意义。基于此,利用高分辨力遥感影像,提出一种针对中国城市用地功能分类的模型。设计一种多分辨力特征融合的卷积神经网络识别遥感影像中的特定功能区;针对中国城市功能区分布的特点,建立一个用于城市用地功能分类的新数据集。实验显示,本文算法在 6种用地功能类型上的分类精确度达 88%,表明算法对城市用地功能分类识别具有较高的准确性。最后,通过对北京部分主要城区的案例研究,验证了所提出的模型在城市规划相关领域提供数据支持的价值和有效性。
遥感影像 用地功能分类 神经网络 城市规划 remote sensing images land use classification neural network urban planning 
太赫兹科学与电子信息学报
2021, 19(1): 132
作者单位
摘要
四川大学电子信息学院,四川成都 610065
人群自动计数问题在视频监控领域引起了广泛关注。近年来,卷积神经网络 (CNN)模型在人群计数方面取得了良好效果。然而,当前对于基于深度学习的人群计数的研究主要停留在 PC端上对单幅静止图片的人群计 数,网络模型参数量巨大,网络结构复杂,消耗的计算资源巨大,难以部署于实际的监控视频人群计数系统。因此,本文采用深度学习的方法,通过对网络模型进行裁剪压缩,同时使用 TensorRT对模型进行加速,在嵌入式 平台上实现了接近实时的人群计数。提出的人群计数平均绝对误差 (MAE)为 21.6且平均每秒帧数 (FPS)为 22,在精确度和速度方面达到了一个很好的平衡,在嵌入式平台上运行速度较快,能达到实时的效果。
人群计数 深度学习 模型压缩 NVIDIA Jeston TX2平台 crowd counting deep learning model compression NVIDIA Jeston TX2 
太赫兹科学与电子信息学报
2020, 18(3): 515
作者单位
摘要
四川大学 电子信息学院,四川 成都 610065
为减少暴恐图像对社会发展和青少年成长造成的不利影响,本文提出一种基于集成分类的暴恐图像自动标注方法,辅助筛除网页中的暴恐信息。该方法将暴恐图像的标注视作多标签分类问题,利用迁移 学习训练多个子网络,然后通过集成学习对子网络的输出进行融合,同时在融合过程中针对各个标签在不同网络上的准确率进行权重分配,最后经过一系列矩阵运算得到图像的标注结果。实验结果表明,与传统机器 学习算法相比,本文方法在准确率和召回率上都有较大提升,并改善了样本不均衡所造成的不同标签类别上模型标注精确度差异较大的问题。
图像标注 多标签分类 集成学习 权重分配 样本不均衡 image annotation multi-label classification ensemble learning weight allocation label category imbalance 
太赫兹科学与电子信息学报
2020, 18(2): 306
作者单位
摘要
1 四川大学 电子信息学院,四川 成都 610065
2 上海交通大学 电子信息与电气工程学院,上海 200240
3 北京百度网讯科技有限公司,北京 100085
分布式视频编码(DVC)与传统视频编码之间的转码为移动终端设备之间的低功耗视频通信提供了一种有效的实现思路。以DVC与HEVC转码为研究对象,利用DVC解码端信息,针对高效视频编码(HEVC)中复杂度极高的编码单元(CU)划分过程进行复杂度优化研究。在DVC解码端提取与CU划分相关的纹理复杂度、运动矢量及预测残差3种特征信息;在HEVC编码端基于朴素贝叶斯原理建立CU快速划分模型,模型生成后便可以通过输入特征信息对当前CU划分进行快速决策,避免大量率失真(RD)代价计算过程。实验结果表明,本方案在编码比特率略有上升的情况下大幅缩短了HEVC编码时间,平均下降幅度达到58.26%,且几乎不影响视频质量。
分布式视频编码 高效视频编码 朴素贝叶斯 分类模型 CU 快速划分 Distributed Video Coding High Efficiency Video Coding naive Bayes classification model CU fast partition 
太赫兹科学与电子信息学报
2020, 18(2): 235

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!