作者单位
摘要
四川大学电子信息学院, 四川 成都 610065
针对分布式视频编码(DVC)系统鲁棒传输问题, 设计了一种基于层修复的 DVC系统传输框架。该传输框架首先对关键帧 (K帧)同时采用高效视频编码 (HEVC)帧内编码和 Wyner-Ziv编码, 并将校验信息(Wyner-Ziv码流)作为修复层码流存入缓存中。若当前关键帧有丢失, 则向编码端请求该帧对应的层修复码流, 在解码端对错误块进行修复, 获得关键帧解码质量的提升。同时, 研究了层修复码率估计算法, 利用已成功解码的位平面辅助完成算法重建。实验结果表明, 该传输框架利用关键帧的层修复码流对关键帧失真部分进行了修复, 提高了关键帧质量, 改善了边信息质量, 实现了 DVC的鲁棒传输。
分布式视频编码 Wyner-Ziv编码 关键帧 鲁棒传输 修复层 Distributed Video Coding Wyner-Ziv video coding Key frame robust transmission repair layer 
太赫兹科学与电子信息学报
2023, 21(1): 82
作者单位
摘要
四川大学电子信息学院,四川 成都 610065
针对背景感知相关滤波器的空间正则化权重固定,不适应目标变化和增大搜索区域,易引入背景噪声导致滤波器判别力下降等问题,本文提出一种基于自适应空间正则化和畸变抑制的相关滤波跟踪算法。首先提取FHOG 特征、CN 特征和灰度特征以增强算法模型对目标的表达能力;其次,在目标函数中加入畸变抑制项来约束当前帧的响应图,增强滤波器的判别能力,以缓解滤波器模型退化问题;最后,在目标函数中加入自适应空间正则化项使空间正则化权重能够随着目标的变化而更新,使得滤波器能充分利用目标的多样性信息。本文在公开数据集OTB-2013、OTB-2015和VOT2016 上进行实验,以对所提算法进行评估。实验结果表明:本文算法速度为20 f/s,距离精度和成功率等评估指标均优于对比算法,在遮挡、背景干扰、旋转变化等多种复杂场景下都有良好的鲁棒性。
目标跟踪 相关滤波 畸变抑制 自适应空间正则化 object tracking correlation filter aberrance repression adaptive spatial regularization 
光电工程
2021, 48(1): 200068
作者单位
摘要
1 四川大学 电子信息学院, 四川 成都 610065
2 中国民航局第二研究所, 四川 成都 610000
夜间有雾环境中拍摄的图片具有光照不均、对比度低且模糊的现象。本文通过分析夜间有雾图像的成像特点, 提出一种有效的夜间图像去雾方法。首先, 在估计大气光时使用加权差分图像作为参考进行引导滤波来估计含轮廓信息的大气光; 使用拉普拉斯锐化灰度图像作为参考引导滤波来估计补充细节的大气光, 然后将算出的两种大气光融合得到最终的大气光。最后, 基于广泛使用的雾霾场景成像模型, 本文算法结合暗通道和亮通道构建了双通道联合优化的透射率函数, 在计算透射率的过程中加入了自适应权重系数、限制对比度自适应直方图均衡化和引导滤波来提高透射率函数的精度。实验结果表明, 在测试图片上计算的信息熵平均值为7.587 2, 对比度均值为23.809 7, 和对比算法相比均有一定提升。所提算法去雾结果视觉效果良好, 在去雾的同时可以有效减少细节的损失。
加权差分 拉普拉斯锐化 暗通道 亮通道 自适应权重系数Z weighted channel difference Laplace sharpening dark channel light channel adaptive weight coefficient 
液晶与显示
2021, 36(4): 596
作者单位
摘要
四川大学电子信息学院,四川成都 610065
针对视觉问答 (VQA)任务中现存深度协同注意模型只考虑问题引导图像的单向注意方式,导致多模态学习交互性不足的问题,提出一种多模态双向导向注意力网络。该网络由多模态特征提取模块、双向导向注意力模块、特征融合模块以及分类器组成。将提取出的图像和问题特征分别经过层层注意后输出加权的注意特征;经过特征线性融合后送入 softmax分类器,得到问题的预测答案;再结合计数模块提升模型的计数能力。结果表明,该模型在公共数据集 VQA v2.0上表现良好,在 test_dev和 test_std测试子集上分别获得 70.77%、71.28 %的总体分类准确率,与大多数先进模型相比,体现出一定优势。
视觉问答 深度协同注意 单向注意 双向导向注意 特征融合 Visual Question Answering deep collaborativeattention unidirectional attention bidirectional guided attention feature fusion 
太赫兹科学与电子信息学报
2021, 19(1): 156
作者单位
摘要
四川大学电子信息学院,四川成都 610065
人群自动计数问题在视频监控领域引起了广泛关注。近年来,卷积神经网络 (CNN)模型在人群计数方面取得了良好效果。然而,当前对于基于深度学习的人群计数的研究主要停留在 PC端上对单幅静止图片的人群计 数,网络模型参数量巨大,网络结构复杂,消耗的计算资源巨大,难以部署于实际的监控视频人群计数系统。因此,本文采用深度学习的方法,通过对网络模型进行裁剪压缩,同时使用 TensorRT对模型进行加速,在嵌入式 平台上实现了接近实时的人群计数。提出的人群计数平均绝对误差 (MAE)为 21.6且平均每秒帧数 (FPS)为 22,在精确度和速度方面达到了一个很好的平衡,在嵌入式平台上运行速度较快,能达到实时的效果。
人群计数 深度学习 模型压缩 NVIDIA Jeston TX2平台 crowd counting deep learning model compression NVIDIA Jeston TX2 
太赫兹科学与电子信息学报
2020, 18(3): 515
作者单位
摘要
四川大学 电子信息学院,四川 成都 610065
为减少暴恐图像对社会发展和青少年成长造成的不利影响,本文提出一种基于集成分类的暴恐图像自动标注方法,辅助筛除网页中的暴恐信息。该方法将暴恐图像的标注视作多标签分类问题,利用迁移 学习训练多个子网络,然后通过集成学习对子网络的输出进行融合,同时在融合过程中针对各个标签在不同网络上的准确率进行权重分配,最后经过一系列矩阵运算得到图像的标注结果。实验结果表明,与传统机器 学习算法相比,本文方法在准确率和召回率上都有较大提升,并改善了样本不均衡所造成的不同标签类别上模型标注精确度差异较大的问题。
图像标注 多标签分类 集成学习 权重分配 样本不均衡 image annotation multi-label classification ensemble learning weight allocation label category imbalance 
太赫兹科学与电子信息学报
2020, 18(2): 306
作者单位
摘要
四川大学 电子信息学院,四川 成都 610065
针对联合图像专家组(JPEG)标准设计了一种基于自适应下采样和超分辨力重建的图像压缩编码框架。在编码器端,为待编码的原始图像设计了多种不同的下采样模式和量化模式,通过率失真优化算法从 多种模式中选择最优的下采样模式(DSM)和量化模式(QM),最后待编码图像将在选择的模式下进行下采样和JPEG编码;在解码器端,采用基于卷积神经网络的超分辨力重建算法对解码后的下采样图像进行重建。此外, 所提出的框架扩展到JPEG2000压缩标准下同样有效可行。仿真实验结果表明,相比于主流的编解码标准和先进的编解码方法,提出的框架能有效地提升编码图像的率失真性能,并能获得更好的视觉效果。
图像压缩 自适应下采样 超分辨力重建 率失真优化 image compression adaptive downsampling super-resolution rate distortion optimization 
太赫兹科学与电子信息学报
2020, 18(2): 298
作者单位
摘要
四川大学 电子信息学院,四川 成都 610065
近年来,卷积网络深度学习已在图像处理、目标检测等领域取得巨大成功。受其启发,将卷积神经网络(CNN)应用于传统视频压缩标准已成为一个新的研究热点。本文提出一种集成卷积神经网络的高效视 频编码(HEVC)压缩改进算法,将下采样过程、HEVC的编解码过程、上采样及质量增强过程集成为一体。为高效提取视频帧的结构特征,在所提压缩算法中集成了两个卷积神经网络。提出了一种下采CNN(DwSCNN)代替双 三次下采,在有效降低分辨率的同时保留细节信息,得到更为紧凑的低分辨率视频序列,将此低分辨率视频序列通过HEVC帧内编码进行进一步的数据量压缩,通过提出一个质量增强CNN(PPCNN)来改善解码后恢复到原 始分辨率的降质视频序列。实验结果显示,本文压缩改进算法在低码率段与标准HEVC相比,能达到更好的质量重建,并且在接近一致的PSNR值时,能节省39.46%的时间和11.04%的比特率,本文算法的视频压缩性能优 于HEVC标准算法和相关文献方法。
卷积神经网络 集成 高效视频编码 下采样 Convolutional Neural Network integrated HEVC down-sampling 
太赫兹科学与电子信息学报
2020, 18(2): 291
作者单位
摘要
1 四川大学 电子信息学院,四川 成都 610065
2 上海交通大学 电子信息与电气工程学院,上海 200240
3 北京百度网讯科技有限公司,北京 100085
分布式视频编码(DVC)与传统视频编码之间的转码为移动终端设备之间的低功耗视频通信提供了一种有效的实现思路。以DVC与HEVC转码为研究对象,利用DVC解码端信息,针对高效视频编码(HEVC)中复杂度极高的编码单元(CU)划分过程进行复杂度优化研究。在DVC解码端提取与CU划分相关的纹理复杂度、运动矢量及预测残差3种特征信息;在HEVC编码端基于朴素贝叶斯原理建立CU快速划分模型,模型生成后便可以通过输入特征信息对当前CU划分进行快速决策,避免大量率失真(RD)代价计算过程。实验结果表明,本方案在编码比特率略有上升的情况下大幅缩短了HEVC编码时间,平均下降幅度达到58.26%,且几乎不影响视频质量。
分布式视频编码 高效视频编码 朴素贝叶斯 分类模型 CU 快速划分 Distributed Video Coding High Efficiency Video Coding naive Bayes classification model CU fast partition 
太赫兹科学与电子信息学报
2020, 18(2): 235
作者单位
摘要
四川大学 电子信息学院, 成都 610065
针对现有人群密度估计方法在实际应用中容易受到环境干扰、适应性不强等限制, 提出一种基于多信息卷积神经网络的人群密度估计方法。首先, 根据样本数据的特点生成数据密度图标注与数据增强; 然后, 为适应不同真实场景的巨大差异, 提取图像的色调、色饱和度、灰度(HSG)信息作为训练数据的输入, 并利用共享卷积层、结合两个子网络不同卷积深度的特征构建网络模型; 最后, 对网络输出的密度图进行积分, 得到相应的人数。与主流方法对比, 在Shanghaitech数据集上进行的相关实验证明了所提方法的良好性能。
计算机视觉 人群密度估计 卷积神经网络 密度图 computer vision crowd density estimation convolutional neural network density map 
光电技术应用
2019, 34(6): 40

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!