作者单位
摘要
哈尔滨师范大学 计算机科学与信息工程学院, 哈尔滨 150025
为了减少有效卷积算子(ECO)跟踪算法的特征提取网络参数量和计算量, 采用了一种基于端侧神经网络(GhostNet)改进的ECO目标跟踪算法。首先, 采用GhostNet网络作为主干特征提取网络提取图像浅层与深层的卷积特征, 运用全局平均池化对卷积特征下采样增加特征对图像的表征能力; 其次, 将卷积特征与手工特征插值后, 与当前滤波器在傅里叶域进行卷积计算实现目标定位; 最后, 采用共轭梯度算法优化响应误差与惩罚项之和的损失函数实现滤波器更新。在上述提出的算法和OTB2015与VOT2018数据集上进行了理论分析和实验验证, 取得了目标跟踪的对比实验数据。结果表明, 相对于基于ResNet特征提取网络的ECO算法, 该算法在实现高精度跟踪时, 卷积特征提取过程计算量减少了95.75%, 参数量减少了79.69%, 跟踪过程速度提升了160%。这些结果为轻量级目标跟踪算法的研究提供了参考。
图像处理 目标跟踪 端侧神经网络 有效卷积算子 全局平均池化 卷积特征 image processing target tracking GhostNet efficient convolution operators global average pooling convolution feature 
激光技术
2022, 46(2): 239
作者单位
摘要
1 上海海洋大学信息学院,上海 201306
2 上海建桥学院信息技术学院,上海 201306
针对当前交互式活体检测过程繁琐、用户体验性差的问题,提出了一种优化LeNet-5 和近红外图像的静默活体检测方法。首先,采用近红外光摄像头构建了一个非活体数据集;其次,通过增大卷积核、增加卷积核数目、引入全局平均池化等方法对LeNet-5 进行了优化,构建了一个深层卷积神经网络;最后,将近红外人脸图片输入到模型中实现活体静默活体检测。实验结果表明,所设计的模型在活体检测数据集上有较高的识别率,为99.95%,整个静默活体检测系统的运行速度约为18~22 帧/s,在实际应用中鲁棒性较高。
卷积神经网络 全局平均池化 近红外图像 静默活体检测 LeNet-5 LeNet-5, convolutional neural network, global aver 
红外技术
2021, 43(9): 845
作者单位
摘要
1 福州大学机械工程及自动化学院, 福建 福州 350108
2 福建医科大学附属第一医院, 福建 福州 350005
光学相干断层扫描是目前检测糖尿病视网膜黄斑病变较为灵敏的方法之一,但病变的人工判断易产生主观失误,且比较耗时。为此,本文在迁移学习的基础上提出了一种改进的深度学习网络,用于视网膜图像的自动分类。先基于自适应阈值联合高斯滤波算法对图像进行预处理;然后以预训练模型为基础,通过微调解决样本差异的问题,并以全局平均池化方法替代传统的全连接层来提取深层特征,以降低网络的过拟合现象。基于实验数据对该网络进行验证,所提网络对视网膜病变图像的分类准确率可达97.3%,说明了所提网络对视网膜黄斑病变图像自动分类的有效性。
医用光学 光学相干断层扫描 迁移学习 高斯滤波 微调 全局平均池化 
激光与光电子学进展
2021, 58(1): 0117002
作者单位
摘要
长安大学电子与控制工程学院, 陕西 西安 710064
由于混凝土路面光照强度不均匀、背景复杂、噪声干扰大,传统的裂缝检测算法难以准确提取其裂缝特征。为了在提高裂缝检测准确性的同时减少计算冗余,提出了一种将低秩核和组卷积结合的交错低秩组卷积混合深度网络的路面裂缝检测算法。首先利用重叠滑动窗口裁剪方法建立裂缝图像数据集,在训练集上生成一个具有较好鲁棒性的分类器,对裂缝及非裂缝图像进行分类,然后采用自适应阈值法得到边缘轮廓清晰的裂缝二值化图像,最后采用中轴线法求取裂缝最大宽度。在测试集上验证模型的性能,实验结果表明测试精度为0.9726,效果优于经典的裂缝检测算法,而且相对于卷积神经网络及其变体大幅减少了模型参数,处理图像的速度达到了每秒14张,并且在三个公开数据集上都达到了较好的检测效果。在2.5 mm以上的裂缝宽度上,计算相对误差小于0.02,较好地达到了工程实际要求。
图像处理 裂缝检测 低秩组卷积 全局平均池化 自适应阈值 裂缝最大宽度 
激光与光电子学进展
2020, 57(14): 141031
作者单位
摘要
昆明理工大学信息工程与自动化学院, 云南 昆明 650500
人脸表情会受到姿势、物体遮挡、光照变化以及人种性别年龄等因素的影响,需要卷积神经网络更有效准确地学习特征。AlexNet在表情识别中准确率不高,对输入图像尺寸有限制,针对这些问题,提出了改进AlexNet网络的人脸表情识别算法。在AlexNet网络中引入多尺度卷积更加适用于小尺寸的表情图像,提取出不同尺度的特征信息,并在把多个低层次特征信息在向下传递的同时与高层次特征信息进行跨连接特征融合,从而可以更加完整准确地反映图像信息,构造出更准确的分类器。跨连接会产生参数爆炸,导致网络训练困难,影响识别效果,因此利用全局平均池化对低层次特征信息进行降维,可减少跨连接产生的参数和过拟合现象。本文算法在CK+、JAFFE数据库上的准确率分别为94.25%和93.02%。
图像处理 图像分类 表情识别 AlexNet 特征提取 多尺度卷积 跨连接 全局平均池化 特征融合 
激光与光电子学进展
2020, 57(14): 141026

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!