作者单位
摘要
云南大学信息学院,云南 昆明 650500
鉴别野生菌的种类是预防误食有毒野生菌的重要途径。因此,为了提高野生菌细粒度识别分类的准确率,对卷积模块的注意力机制模块(CBAM)进行改进,提出了一种并行相加卷积模块的注意力机制模块PA_CBAM,将CBAM中的通道注意力模块和空间注意力模块从原来的串行连接改为并行连接并相加,解决了2种注意力模块因串行连接带来的互相干扰问题。另外,参考特征金字塔的思想改进ResNet50,其Top-1和Top-5准确率达到86.03%和97.19%,较原来提升0.86和0.73个百分点;其添加PA_CBAM后在Top-1和Top-5准确率达到88.52%、97.58%,较CBAM模块提高了3.03和0.69个百分点。此外,为了将模型移植到移动端,结合迁移学习,提出了MobileNet_v2+PA_CBAM的识别方法,准确率达到94.87%,较之前提升0.66个百分点。研究表明:提出的注意力机制模块PA_CBAM在野生菌细粒度识别研究中具有更好的识别效果,具有一定的泛用性,并且MobileNet_v2+PA_CBAM训练后模型大小仅为27.8 MB,识别图片的平均耗时仅为1.3 ms,是在移动端部署野生菌识别的理想模型。
图像识别 细粒度分类 特征融合 注意力机制 迁移学习 
激光与光电子学进展
2023, 60(4): 0410004
作者单位
摘要
云南大学信息学院,云南 昆明 650500
鉴于国内野生菌中毒事件频发,拟采用深度学习技术来解决这一社会问题。但由于野生菌图像的类间差异较小,图像背景复杂,细粒度识别精度较低。针对这一问题,提出了一种改进的ResNeXt50网络。首先设计了一种多尺度特征引导(MSFG)模块,通过短连接引导网络充分学习和利用低级特征与高级特征;接着采用改进的注意力机制模块来减少网络对复杂背景的学习;最后对模型中的不同层级特征进行融合,利用得到的联合特征进行识别。实验结果表明,所提改进模型在测试集上的准确率可以达到96.47%,较未改进的ResNeXt50网络,在准确率上提升了2.64个百分点。对比结果显示,相较VGG19、DenseNet121、Inception_v3、ResNet50、ShuffleNet_v2这5个网络模型,所提改进模型在准确率上分别提升了8.10个百分点、5.13个百分点、3.24个百分点、3.30个百分点、4.25个百分点。
图像识别 细粒度 多尺度 特征引导 注意力机制 联合特征 
激光与光电子学进展
2022, 59(12): 1210016

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!