同名作者【何小海】论文列表 -- 中国光学期刊网

作者单位

摘要

四川大学电子信息学院, 四川成都 610065

针对分布式视频编码(DVC)系统鲁棒传输问题, 设计了一种基于层修复的 DVC系统传输框架。该传输框架首先对关键帧 (K帧)同时采用高效视频编码 (HEVC)帧内编码和 Wyner-Ziv编码, 并将校验信息(Wyner-Ziv码流)作为修复层码流存入缓存中。若当前关键帧有丢失, 则向编码端请求该帧对应的层修复码流, 在解码端对错误块进行修复, 获得关键帧解码质量的提升。同时, 研究了层修复码率估计算法, 利用已成功解码的位平面辅助完成算法重建。实验结果表明, 该传输框架利用关键帧的层修复码流对关键帧失真部分进行了修复, 提高了关键帧质量, 改善了边信息质量, 实现了 DVC的鲁棒传输。

分布式视频编码 Wyner-Ziv编码关键帧鲁棒传输修复层 Distributed Video Coding Wyner-Ziv video coding Key frame robust transmission repair layer

PDF全文 Full Text

太赫兹科学与电子信息学报

2023, 21(1): 82

基于自适应空间正则化和畸变抑制的相关滤波跟踪

王叶刘强卿粼波滕奇志何小海

作者单位

摘要

四川大学电子信息学院，四川成都 610065

针对背景感知相关滤波器的空间正则化权重固定，不适应目标变化和增大搜索区域，易引入背景噪声导致滤波器判别力下降等问题，本文提出一种基于自适应空间正则化和畸变抑制的相关滤波跟踪算法。首先提取FHOG 特征、CN 特征和灰度特征以增强算法模型对目标的表达能力；其次，在目标函数中加入畸变抑制项来约束当前帧的响应图，增强滤波器的判别能力，以缓解滤波器模型退化问题；最后，在目标函数中加入自适应空间正则化项使空间正则化权重能够随着目标的变化而更新，使得滤波器能充分利用目标的多样性信息。本文在公开数据集OTB-2013、OTB-2015和VOT2016 上进行实验，以对所提算法进行评估。实验结果表明：本文算法速度为20 f/s，距离精度和成功率等评估指标均优于对比算法，在遮挡、背景干扰、旋转变化等多种复杂场景下都有良好的鲁棒性。

PDF全文 Full Text

光电工程

2021, 48(1): 200068

图像处理

暗通道融合亮通道优化的夜间图像去雾算法

李鹏飞 ^1,*何小海 ¹卿粼波 ¹石伟 ²吴小强 ¹

作者单位

摘要

¹ 四川大学电子信息学院, 四川成都 610065

² 中国民航局第二研究所, 四川成都 610000

夜间有雾环境中拍摄的图片具有光照不均、对比度低且模糊的现象。本文通过分析夜间有雾图像的成像特点, 提出一种有效的夜间图像去雾方法。首先, 在估计大气光时使用加权差分图像作为参考进行引导滤波来估计含轮廓信息的大气光; 使用拉普拉斯锐化灰度图像作为参考引导滤波来估计补充细节的大气光, 然后将算出的两种大气光融合得到最终的大气光。最后, 基于广泛使用的雾霾场景成像模型, 本文算法结合暗通道和亮通道构建了双通道联合优化的透射率函数, 在计算透射率的过程中加入了自适应权重系数、限制对比度自适应直方图均衡化和引导滤波来提高透射率函数的精度。实验结果表明, 在测试图片上计算的信息熵平均值为7.587 2, 对比度均值为23.809 7, 和对比算法相比均有一定提升。所提算法去雾结果视觉效果良好, 在去雾的同时可以有效减少细节的损失。

加权差分拉普拉斯锐化暗通道亮通道自适应权重系数Z weighted channel difference Laplace sharpening dark channel light channel adaptive weight coefficient

PDF全文 Full Text

液晶与显示

2021, 36(4): 596

信号与信息处理、计算机与控制

基于多模态双向导向注意的视觉问答

鲜荣 ^*何小海吴晓红卿粼波

作者单位

摘要

四川大学电子信息学院，四川成都 610065

针对视觉问答 (VQA)任务中现存深度协同注意模型只考虑问题引导图像的单向注意方式，导致多模态学习交互性不足的问题，提出一种多模态双向导向注意力网络。该网络由多模态特征提取模块、双向导向注意力模块、特征融合模块以及分类器组成。将提取出的图像和问题特征分别经过层层注意后输出加权的注意特征；经过特征线性融合后送入 softmax分类器，得到问题的预测答案；再结合计数模块提升模型的计数能力。结果表明，该模型在公共数据集 VQA v2.0上表现良好，在 test_dev和 test_std测试子集上分别获得 70.77%、71.28 %的总体分类准确率，与大多数先进模型相比，体现出一定优势。

视觉问答深度协同注意单向注意双向导向注意特征融合 Visual Question Answering deep collaborativeattention unidirectional attention bidirectional guided attention feature fusion

PDF全文 Full Text

太赫兹科学与电子信息学报

2021, 19(1): 156

信号与信息处理、计算机与控制

基于深度学习的视频人群计数系统

向东卿粼波 ^*何小海吴晓红

作者单位

摘要

四川大学电子信息学院，四川成都 610065

人群自动计数问题在视频监控领域引起了广泛关注。近年来，卷积神经网络 (CNN)模型在人群计数方面取得了良好效果。然而，当前对于基于深度学习的人群计数的研究主要停留在 PC端上对单幅静止图片的人群计数，网络模型参数量巨大，网络结构复杂，消耗的计算资源巨大，难以部署于实际的监控视频人群计数系统。因此，本文采用深度学习的方法，通过对网络模型进行裁剪压缩，同时使用 TensorRT对模型进行加速，在嵌入式平台上实现了接近实时的人群计数。提出的人群计数平均绝对误差 (MAE)为 21.6且平均每秒帧数 (FPS)为 22，在精确度和速度方面达到了一个很好的平衡，在嵌入式平台上运行速度较快，能达到实时的效果。

人群计数深度学习模型压缩 NVIDIA Jeston TX2平台 crowd counting deep learning model compression NVIDIA Jeston TX2

PDF全文 Full Text

太赫兹科学与电子信息学报

2020, 18(3): 515

信号与信息处理、计算机与控制

基于集成分类的暴恐图像自动标注方法

严靓周欣何小海 ^*熊淑华卿粼波

作者单位

摘要

四川大学电子信息学院，四川成都 610065

为减少暴恐图像对社会发展和青少年成长造成的不利影响，本文提出一种基于集成分类的暴恐图像自动标注方法，辅助筛除网页中的暴恐信息。该方法将暴恐图像的标注视作多标签分类问题，利用迁移学习训练多个子网络，然后通过集成学习对子网络的输出进行融合，同时在融合过程中针对各个标签在不同网络上的准确率进行权重分配，最后经过一系列矩阵运算得到图像的标注结果。实验结果表明，与传统机器学习算法相比，本文方法在准确率和召回率上都有较大提升，并改善了样本不均衡所造成的不同标签类别上模型标注精确度差异较大的问题。

图像标注多标签分类集成学习权重分配样本不均衡 image annotation multi-label classification ensemble learning weight allocation label category imbalance

PDF全文 Full Text

太赫兹科学与电子信息学报

2020, 18(2): 306

信号与信息处理、计算机与控制

基于自适应下采样和超分重建的图像压缩框架

张达明何小海 ^*任超吴晓红 [ ... ]范梦

作者单位

摘要

四川大学电子信息学院，四川成都 610065

针对联合图像专家组(JPEG)标准设计了一种基于自适应下采样和超分辨力重建的图像压缩编码框架。在编码器端，为待编码的原始图像设计了多种不同的下采样模式和量化模式，通过率失真优化算法从多种模式中选择最优的下采样模式(DSM)和量化模式(QM)，最后待编码图像将在选择的模式下进行下采样和JPEG编码；在解码器端，采用基于卷积神经网络的超分辨力重建算法对解码后的下采样图像进行重建。此外，所提出的框架扩展到JPEG2000压缩标准下同样有效可行。仿真实验结果表明，相比于主流的编解码标准和先进的编解码方法，提出的框架能有效地提升编码图像的率失真性能，并能获得更好的视觉效果。

图像压缩自适应下采样超分辨力重建率失真优化 image compression adaptive downsampling super-resolution rate distortion optimization

PDF全文 Full Text

太赫兹科学与电子信息学报

2020, 18(2): 298

信号与信息处理、计算机与控制

结合卷积神经网络的HEVC帧内编码压缩改进算法

王婷何小海 ^*孙伟恒熊淑华 Karn Pradeep

作者单位

摘要

四川大学电子信息学院，四川成都 610065

近年来，卷积网络深度学习已在图像处理、目标检测等领域取得巨大成功。受其启发，将卷积神经网络(CNN)应用于传统视频压缩标准已成为一个新的研究热点。本文提出一种集成卷积神经网络的高效视频编码(HEVC)压缩改进算法，将下采样过程、HEVC的编解码过程、上采样及质量增强过程集成为一体。为高效提取视频帧的结构特征，在所提压缩算法中集成了两个卷积神经网络。提出了一种下采CNN(DwSCNN)代替双三次下采，在有效降低分辨率的同时保留细节信息，得到更为紧凑的低分辨率视频序列，将此低分辨率视频序列通过HEVC帧内编码进行进一步的数据量压缩，通过提出一个质量增强CNN(PPCNN)来改善解码后恢复到原始分辨率的降质视频序列。实验结果显示，本文压缩改进算法在低码率段与标准HEVC相比，能达到更好的质量重建，并且在接近一致的PSNR值时，能节省39.46%的时间和11.04%的比特率，本文算法的视频压缩性能优于HEVC标准算法和相关文献方法。

卷积神经网络集成高效视频编码下采样 Convolutional Neural Network integrated HEVC down-sampling

PDF全文 Full Text

太赫兹科学与电子信息学报

2020, 18(2): 291

探测制导、测控通信与电子对抗

基于朴素贝叶斯分类的DVC-HEVC 快速转码

华玲 ¹唐韬 ²卿粼波 ^1,*何小海 ¹荣松 ³

作者单位

摘要

¹ 四川大学电子信息学院，四川成都 610065

² 上海交通大学电子信息与电气工程学院，上海 200240

³ 北京百度网讯科技有限公司，北京 100085

分布式视频编码(DVC)与传统视频编码之间的转码为移动终端设备之间的低功耗视频通信提供了一种有效的实现思路。以DVC与HEVC转码为研究对象，利用DVC解码端信息，针对高效视频编码(HEVC)中复杂度极高的编码单元(CU)划分过程进行复杂度优化研究。在DVC解码端提取与CU划分相关的纹理复杂度、运动矢量及预测残差3种特征信息；在HEVC编码端基于朴素贝叶斯原理建立CU快速划分模型，模型生成后便可以通过输入特征信息对当前CU划分进行快速决策，避免大量率失真(RD)代价计算过程。实验结果表明，本方案在编码比特率略有上升的情况下大幅缩短了HEVC编码时间，平均下降幅度达到58.26%，且几乎不影响视频质量。

分布式视频编码高效视频编码朴素贝叶斯分类模型 CU 快速划分 Distributed Video Coding High Efficiency Video Coding naive Bayes classification model CU fast partition

PDF全文 Full Text

太赫兹科学与电子信息学报

2020, 18(2): 235

信号与信息处理

基于多信息卷积神经网络的人群密度估计

赵威吴晓红刘文璨何小海卿粼波

作者单位

摘要

四川大学电子信息学院, 成都 610065

针对现有人群密度估计方法在实际应用中容易受到环境干扰、适应性不强等限制, 提出一种基于多信息卷积神经网络的人群密度估计方法。首先, 根据样本数据的特点生成数据密度图标注与数据增强; 然后, 为适应不同真实场景的巨大差异, 提取图像的色调、色饱和度、灰度(HSG)信息作为训练数据的输入, 并利用共享卷积层、结合两个子网络不同卷积深度的特征构建网络模型; 最后, 对网络输出的密度图进行积分, 得到相应的人数。与主流方法对比, 在Shanghaitech数据集上进行的相关实验证明了所提方法的良好性能。

计算机视觉人群密度估计卷积神经网络密度图 computer vision crowd density estimation convolutional neural network density map

PDF全文 Full Text

光电技术应用

2019, 34(6): 40

关于本站 Cookie 的使用提示

全站搜索

热点聚焦

学术活动

关于本站 Cookie 的使用提示

全站搜索