陈科峻 1,2,*张叶 1
作者单位
摘要
1 中国科学院 长春光学精密机械与物理研究所 应用光学国家重点实验室,吉林 长春 130033
2 中国科学院大学, 北京 100049
常见的目标检测模型由于模型参数量较大,往往难以部署在无人机、卫星等移动嵌入式设备上。为了对船只进行实时监测,将目标检测模型部署在计算能力较弱的设备上,对基于计算机视觉的卫星图像船只目标检测方法进行研究。针对卫星图像中船舰的形状长宽比例特点,采用K-means++聚类算法选取初始的锚点框; 接着对模型进行多尺度训练,将多尺度金字塔图像作为模型训练的输入; 将YOLO-v3目标检测算法的批归一化层的尺度因子作为通道重要性的度量指标,对YOLO-v3模型进行剪枝压缩。实验结果表明,采用的模型剪枝和压缩方法能有效地对模型进行压缩,模型的参数量减少了91.5%,模型检测时间缩短了60%,极大地减少了系统计算性能的开销。当采用的初始锚点框个数为6个时,平均准确率(mAP)达到77.31%,满足了卫星图像船舰实时性检测的需求。
船只检测 聚类算法 模型压缩 通道剪枝 ship detection YOLO-v3 YOLO-v3 clustering algorithm model compression channel pruning 
液晶与显示
2020, 35(11): 1168
陈科峻 1,2张叶 1,*
作者单位
摘要
1 中国科学院大学 长春光学精密机械与物理研究所 应用光学国家重点实验室, 吉林 长春 130033
2 中国科学院大学,北京 100039
由于航空图像背景复杂,包含的物体类别多样,航空图像分类任务仍然面临困难。针对传统航空图像多标签分类算法准确率低、泛化性差的问题,本文提出了一种基于循环神经网络多标签航空图像分类方法。首先,采用超像素分割获取图像的低层特征,通过注意力机制生成注意力特征图;接着,采用交叉验证的方式获取最佳的图像尺度,将多尺度注意力特征图嵌入卷积神经网络中对 图像进行特征提取;最后,采用改进的双向长短期记忆网络挖掘标签之间的相关性,改进的双向长短期记忆网络增加了输入门到输出门之间的连接,使输入状态可以更好地控制每一内存单元输出的 信息,并且将遗忘门和输入门合并成单一的更新门,使得改进的双向长短期记忆网络可以学到更长时期的历史信息。结果显示,在图像变换尺度为1,1.3,2时,模型在UCM多标签数据集上的精确率 和召回率分别达到了85.33%和87.05%,F1值达到了0.862。本文方法相比于原始VGGNet16模型,精确率提高了7.25%,召回率提高了8.94%。实验表明,该方法可以有效提高航空图像多标签分类任务 的准确率。
航空图像分类 多标签 注意力机制 多尺度 卷积神经网络 长短期记忆网络 satellite images classification muilti-label attention mechanisms multi-scale convolutional neural network Long Short-Term Memory(LSTM) network 
光学 精密工程
2020, 28(6): 1404

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!