作者单位
摘要
1 华中光电技术研究所—武汉光电国家研究中心,湖北武汉430223
2 武汉设计工程学院信息工程学院,湖北武汉430225
红外小目标检测通常受制于较远的成像距离,使得提取目标特征成为了一种困难,如何增强目标的特征表达是近些年的主要方向之一。而过于复杂的特征表达会损失推理速度,这对于有实时性要求的红外小目标检测任务是不利的。通过使用重参数化技术结合领域中常用的残差网络作为特征提取网络,再使用额外注意力与通道注意力作为特征增强模块与特征融合模块,在数据集上取得了较好的结果。提出的模型在 SIRST 与 IRSTD-1K 数据集上分别取得了 0.734 与 0.638 的 mIoU 值,同时参数量和计算复杂度只有 0.306 M 与1.114 G FLOPs。该模型能够在推理阶段保持较少参数的同时拥有和其他领先的方法相近甚至领先的性能,在串行运行的环境上有着明显的优势。
红外小目标检测 深度学习 卷积神经网络 模型压缩 注意力机制 infrared small targets detection deep learning convolutional neural networks model compression attention mechanism 
光学与光电技术
2024, 22(1): 10
宁欣 1刘江宽 2,3李卫军 1,*石园 2,3[ ... ]南方哲 4
作者单位
摘要
1 中国科学院半导体研究所, 北京 100083
2 威富集团形象认知计算联合实验室, 北京 102200
3 深圳市威富世界有限公司, 广东 深圳 518102
4 新疆大学软件学院, 新疆 乌鲁木齐 830091
随着实例分割技术在各种场景中的应用越来越广泛, 运行速度和硬件资源占用是该技术在应用中需要考虑的 2个重要因素。最近提出的基于图像原型掩码系数的实例分割网络 (YOLACT)在运行速度方面做得很好, 但是需要设置较大的特征提取网络才能保证分割精确度, 这就导致了模型占用的硬件资源较多, 同时运行速度也受到了限制。在 YOLACT的基础上, 提出一种新的模型, 对实例分割的特征提取网络进行了优化, 先使用基于批量归一化层放缩因子的通道剪枝方法对 YOLACT网络进行压缩, 然后对压缩后的卷积层和批量归一化层进行融合, 最后, 在 COCO val2017上对本文提出的方法进行了评估。实验结果表明, 相比原始的 YOLACT网络, 该方法的模型文件大小可以减少 56.9%, 运行速度提升 28.6%, 运行时显存占用也降低了 13.6%, 有效地减少了硬件资源占用, 并且提升了运行速度。
实例分割 模型压缩 通道剪枝 运行效率 instance-segmentation model-compression channel-pruning running efficiency 
太赫兹科学与电子信息学报
2023, 21(1): 95
作者单位
摘要
天津大学电气自动化与信息工程学院,天津 300072
模型压缩可以有效地促进卷积神经网络在资源受限设备上的部署。作为一个研究热点,滤波器剪枝已经受到了从学术界到工业界的广泛关注。滤波器剪枝的本质是对重要滤波器进行选择和保留。然而,现有的研究主要集中在静态滤波器和局部滤波器的选择上,压缩后的模型仍然存在一定的冗余。基于此,提出了一种自适应动态滤波器剪枝方法,该方法通过引入一个激活权值生成模块来生成每个滤波器的激活值。将模块嵌入各种经典网络中,来动态评估卷积层中所有滤波器的重要性,并自适应地选择能提取更丰富信息的滤波器来重构剪枝后的网络。在CIFAR-10和AUC数据集上使用不同卷积神经网络进行了实验,所提方法在CIFAR-10数据集上与目前几种主流的剪枝方法相比具有更优越的性能。在AUC数据集上进行剪枝前后压缩70%左右计算量的情况下,准确率下降不超过0.3个百分点。在不同网络上的实验证明了该方法在不同模型上的泛化能力。
机器视觉 深度学习 卷积神经网络 滤波器剪枝 分类模型 模型压缩 
激光与光电子学进展
2022, 59(24): 2415003
作者单位
摘要
石家庄铁道大学 信息科学与技术学院,河北石家庄050043
多元场景中行人检测是当前计算机视觉领域的研究热点,尽管备受关注的深度学习能够提供很高的检测精度,但随之而来的高复杂度运算严重限制了其在可移动平台上的部署。为此,本文提出了一种面向多元场景的轻量级行人检测算法。该算法首先构建深、浅层特征融合网络以学习多尺度行人的纹理特性;然后设计了跨维特征引导注意力模块,用于保留特征提取过程中通道间、空间内的交互信息。最后基于剪枝策略去除模型中的冗余通道,以降低算法复杂度。此外,本文还设计了自适应Gamma矫正算法,以消减多元场景下光照、阴影等外界干扰对检测结果的影响。实验结果表明,本文所提方法在检测精度相当的条件下,能将模型大小压缩至10 MB,处理速度可达93 Frame/s,明显优于当前主流方法。
行人检测 多元场景 轻量级网络 跨维特征引导 模型压缩 pedestrian detection multiple scenes lightweight network cross-dimensional feature guidance model compression 
光学 精密工程
2022, 30(14): 1764
作者单位
摘要
1 五邑大学 智能制造学部,广东 江门 529020
2 华南理工大学 自动化科学与工程学院,广州 510640
现有的指静脉分割网络大多需要消耗极大内存和计算资源,难以直接部署到嵌入式平台上,大部分模型轻量化方法存在参数减小导致分割性能急剧下降、算力受限和实时性等问题。针对上述问题,本文提出了一种超轻量级指静脉纹络实时分割网络—SGUnet。首先,使用沙漏状的深度可分离卷积极大地减少基础模型参数,并采用轻量级高效注意力模块实现无降维的局部跨通道交互,提升网络分割性能。其次,为了解决部分特征图存在冗余的问题,使用Cheap operation来替代部分“懈怠”的卷积核,得到相似的特征图。最后,采用特征信息交互的方法,打开分组卷积的组间通道,解决了分组特征组之间信息不流通的问题。与传统Unet分割网络相比,最终的SGUnet模型参数量约为传统Unet分割网络的1%,Mult-Adds约为0.5%。在两个公开的手指静脉数据集SDU-FV、MMCBNU-6000上验证网络性能,结果表明SGUnet网络在分割性能上不仅优于大型分割网络Unet、DU-Net、R2U-Net,而且超越了经典轻量级改进模型squeeze-Unet、Mobile-Unet、shuffle-Unet、Ghost-Unet。SGUnet网络Accuracy、Dice、AUC分别达到94.11%、0.538 4、0.935 4,并且在NVIDIA嵌入式平台上指静脉纹络提取的测试速度高达0.27秒/张。
手指静脉分割 轻量级网络 嵌入式平台 模型压缩 实时分割网络 图像分割 卷积神经网络 Finger vein segmentation Lightweight network Embedded platform Model compression Real-time segmentation network Image segmentation Convolutional neural network 
光子学报
2022, 51(2): 0210009
作者单位
摘要
1 中国科学院 长春光学精密机械与物理研究所, 吉林 长春 130033
2 中国科学院大学, 北京 100049
3 中国人民解放军联勤保障部队第946医院 医学工程科, 吉林 长春 130033
近年来, 航空光学成像技术快速发展, 机载图像处理系统对于目标检测精度和检测速度的要求越来越高, 传统的目标检测算法已经无法满足要求。与此同时, 基于深度学习的目标检测算法凭借更优的性能表现得到了学术界的广泛关注。但这类算法往往参数较多, 时间复杂度高且移动端移植困难。针对上述问题, 本文提出了一种基于Yolo V3算法的MPSOC平台实现方案。利用改进的k均值聚类算法获取新的初始锚框, 之后通过改变特征图的大小提高算法对小目标的检测精度, 通过基于敏感度的剪枝方法压缩算法大小, 最后利用VISDRONE数据集在MPSOC平台进行了验证。实验结果表明: 改善的Yolo算法的MAP提高了1.3%, 误检率也得到了极大降低。算法经过压缩后, 检测速度提高了1倍, 体积仅为原来的37%, 基本满足了对航空图像目标检测的设计要求, 同时为深度学习算法在MPSOC中实现提供了可行的解决方案。
航空图像 目标检测 模型压缩 aviation image target detection model compression MPSOC MPSOC 
液晶与显示
2021, 36(7): 1006
张有波 1,2郭威 2,3,*周悦 1徐高飞 2[ ... ]孙洪鸣 2,3
作者单位
摘要
1 上海海洋大学工程学院, 上海 201306
2 中国科学院深海科学与工程研究所, 海南 三亚 572000
3 中国科学院大学, 北京 100049
针对水下机器人搭载平台进行深海遗迹探寻所面临的数据样本缺乏、采集图像模糊、嵌入式系统计算能力有限的问题,分别在数据增强、视频增强和目标检测算法压缩等方面提出了有效的解决方案。首先,利用数据增强提高小样本数据的泛化能力,通过迁移学习进行知识迁移,加速模型收敛;然后,基于结构相似性对采集视频进行关键帧图像选择,采用限制对比度直方图拉伸对选择后的关键帧进行实时图像增强;最后,基于多粒度剪枝策略对YOLOV4进行通道和卷积层的双向压缩。实验结果表明,压缩后的YOLOV4模型运算复杂度(BFLOPS)降为10.588,在Jetson TX2嵌入式图像处理器上,对大小为640 pixel×480 pixel的输入图像的平均检测速度可以达到18.2 frame/s。
图像处理 视频图像增强 模型压缩 嵌入式图像处理器 目标检测 水下机器人 
激光与光电子学进展
2021, 58(14): 1410019
作者单位
摘要
1 郑州工程技术学院 文化遗产学院, 河南 郑州 450044
2 河南大学 教育科学学院, 河南 开封 475004
近年来, 深度学习算法发展迅速, 并广泛应用于目标检测的任务。然而, 在内存和计算能力等条件受限制的设备上, 无法进行实时性的目标检测。针对这一问题, 提出了一种在内存和处理单元受限的监视系统中检测行人的快速方法。针对一般行人检测中提取高维度行人特征导致检测效率低的问题, 将改进的方向梯度直方图(HOG)和Sobel边缘图像局部二元模式算法(Sobel-LBP)进行融合作为特征, 提出基于教师-学生框架的模型压缩技术, 将其应用于随机森林(RF)分类器, 不使用深度网络, 因为经过压缩的深度网络仍然需要大量的内存用于处理参数乘法运算。通过使用教师随机森林(T-RF)输出的soft target来训练学生浅层随机森林(S-RF), 也称再生随机森林(BARF), 让其模仿T-RF的表现; 通过BARF分类器进行行人检测, 最后使用滑动窗口法检测出行人。实验证明, 与T-RF相比, 提出方法的速度提高了2.05倍, 压缩率提高了5.39倍, 并且其检测性能也较为理想。
信息光学 行人检测 视频监视 师生框架 模型压缩 双级随机森林 information optics pedestrian detection surveillance video teacher-student framework model compression two-level random forest 
光学技术
2020, 46(6): 741
陈科峻 1,2,*张叶 1
作者单位
摘要
1 中国科学院 长春光学精密机械与物理研究所 应用光学国家重点实验室,吉林 长春 130033
2 中国科学院大学, 北京 100049
常见的目标检测模型由于模型参数量较大,往往难以部署在无人机、卫星等移动嵌入式设备上。为了对船只进行实时监测,将目标检测模型部署在计算能力较弱的设备上,对基于计算机视觉的卫星图像船只目标检测方法进行研究。针对卫星图像中船舰的形状长宽比例特点,采用K-means++聚类算法选取初始的锚点框; 接着对模型进行多尺度训练,将多尺度金字塔图像作为模型训练的输入; 将YOLO-v3目标检测算法的批归一化层的尺度因子作为通道重要性的度量指标,对YOLO-v3模型进行剪枝压缩。实验结果表明,采用的模型剪枝和压缩方法能有效地对模型进行压缩,模型的参数量减少了91.5%,模型检测时间缩短了60%,极大地减少了系统计算性能的开销。当采用的初始锚点框个数为6个时,平均准确率(mAP)达到77.31%,满足了卫星图像船舰实时性检测的需求。
船只检测 聚类算法 模型压缩 通道剪枝 ship detection YOLO-v3 YOLO-v3 clustering algorithm model compression channel pruning 
液晶与显示
2020, 35(11): 1168
作者单位
摘要
四川大学电子信息学院,四川成都 610065
人群自动计数问题在视频监控领域引起了广泛关注。近年来,卷积神经网络 (CNN)模型在人群计数方面取得了良好效果。然而,当前对于基于深度学习的人群计数的研究主要停留在 PC端上对单幅静止图片的人群计 数,网络模型参数量巨大,网络结构复杂,消耗的计算资源巨大,难以部署于实际的监控视频人群计数系统。因此,本文采用深度学习的方法,通过对网络模型进行裁剪压缩,同时使用 TensorRT对模型进行加速,在嵌入式 平台上实现了接近实时的人群计数。提出的人群计数平均绝对误差 (MAE)为 21.6且平均每秒帧数 (FPS)为 22,在精确度和速度方面达到了一个很好的平衡,在嵌入式平台上运行速度较快,能达到实时的效果。
人群计数 深度学习 模型压缩 NVIDIA Jeston TX2平台 crowd counting deep learning model compression NVIDIA Jeston TX2 
太赫兹科学与电子信息学报
2020, 18(3): 515

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!