1 重庆邮电大学通信与信息工程学院,重庆 400065
2 重庆邮电大学智能通信与网络安全研究院,重庆 400065
提出了一种渐进式训练方案来重新配置马赫-曾德尔干涉仪(MZI)前馈光学神经网络(ONN)的相移,从而对抗MZI的相位误差和分束器误差,提高识别准确率。为了验证所提方案,利用Neuroptica Python仿真平台搭建了3层MZI-ONN结构,并在考虑到MZI相位误差和分束器误差的情况下,利用Iris和MNIST数据集验证了所提方案的有效性。仿真结果表明:在Iris数据集下,对于3层4×4 MZI-ONN结构,所提方案的识别准确率能够提升64.15百分点;在MNIST数据集下,对于4×4、6×6、8×8和16×16规模的MZI-ONN,所提方案的识别准确率能够提升2.00~37.00百分点。所提方案极大地提高了MZI-ONN的抗误差性能,有助于未来大规模、高准确率MZI-ONN的实现。
光计算 马赫-曾德尔干涉仪 光学神经网络 相位误差 分束器误差 渐进式训练 抗误差
1 中科技术物理苏州研究院,江苏 苏州215000
2 中科技术物理苏州研究院,江苏 苏州215000中国科学院上海技术物理研究所,上海200083中国科学院红外探测与成像技术重点实验室,上海200083
大量的训练样本可有效缓解模型过拟合,从而提高分类效果。在初始标记样本较少的情况下,开展借助不同尺度的同质区快速扩增大量高精度训练样本的实验,并利用初始标记样本和扩增样本训练支持向量机(Support Vector Machine, SVM)分类器,实现对高光谱数据的有效分类。该方法在Pavia University、Salinas和Indian Pines三种高光谱数据上均能获得大量高精度的训练样本,分类精度分别达到99%、99%和97%以上。实验结果表明,扩增的大量伪标签样本可以有效训练SVM分类器,提高分类效果。
高光谱影像 半监督分类 多尺度同质区 训练样本扩增 图像分割 支持向量机 hyperspectral image semi-supervised classification multi-scale homogeneous regions training sample amplification image segmentation SVM
1 北京师范大学 人工智能学院, 北京 100875
2 济南大学 信息科学与技术学院, 山东 济南 250002
为了解决脉冲星识别研究局限在常规分类算法的视野中而缺乏针对性的问题, 文章针对脉冲星数据集的特点, 挖掘其内在特征与其他研究领域的关联性, 发现了脉冲星数据与长尾分布之间存在的联系, 探求脉冲星数据与长尾分布的特征一致性, 首次将脉冲星数据分布看作长尾分布的一种特例。并从长尾视觉识别视角中的优化训练策略角度出发, 提出了一种基于解耦训练策略的脉冲星识别算法。算法采用解耦训练策略, 在操作上简捷高效, 具备更强的可移植性。经过数据集的验证, 算法能有效改善决策边界, 在HTRU_bands和HTRU_ints数据集的召回率相较于对比方法分别提升了11.8%和13%, 是一种性价比较高的有效识别算法。
脉冲星识别算法 长尾分布 解耦训练 pulsar recognition algorithm long-tail distribution decoupling training
海军航空大学航空基础学院, 山东 烟台 264000
飞行动作识别对飞行训练质量评估、提升飞行员的驾驶技术具有重要意义。在飞行动作序列数据中, 某时刻飞行状态数据及该状态对应的某些飞参数据对飞行动作识别有非常重要的贡献, 但传统的注意力机制只关注上层状态特征的贡献值, 而忽略了下层特征的影响。为有效提取飞参数据的关键特征表示, 提出聚焦注意力(FA)机制, 扩展了传统注意力机制, 进一步聚焦注意力, 学习其下层特征对上层的贡献。同时, 本研究将FA机制扩展到BiLSTM网络中, 提出FA-BiLSTM网络模型, 该模型不仅重点关注飞行动作序列中关键时刻的飞行状态数据, 还可学习该飞行状态中关键的飞参数据。实验表明, 该方法有效提升了飞行动作识别的准确率, 加权平均准确率达到了94%。
飞行动作 聚焦注意力 飞行训练 飞参数据 注意力机制 flight action focus attention flight training flight parameter data attention mechanism
南京邮电大学通信与信息工程学院,江苏 南京 210003
面向数字图像识别,使用光学器件构建基于快速傅里叶变换(FFT)的光学神经网络(ONN),其中的线性光学处理单元由马赫-曾德尔干涉仪(MZI)实现。这些MZI以网格状布局连接,对通过的光信号进行调制,实现乘法和加法,从而实现对图像的分类识别。针对该ONN对手写数字图像进行识别出现的问题,研究训练算法中的主要超参数即动量系数和学习率对网络性能的影响。首先比较不同学习率下随机梯度下降(SGD)、均方根传递(RMSprop)、适应性矩估计(Adam)和自适应梯度(Adagrad)4种训练算法结合不同非线性函数和不同隐藏层个数后,ONN在识别手写数字图像上的表现。实验结果显示:在学习率从0.5变化到5×10-5、RMSprop训练算法下,具有2个隐藏层、非线性函数为Softplus的FFT型ONN具有最高的识别精确度,达97.4%。此外,着重分析在具有不同动量系数的SGD算法结合不同非线性函数和不同隐藏层个数时ONN对手写数字图像识别的准确率、运行内存和训练时间的影响。进一步,在学习率为0.05和0.005时,比较了SGD、RMSprop训练算法以及各自在引入动量后的网络识别性能。实验结果显示:动量系数为0时,采用SGD算法训练的具有2个隐藏层、非线性函数为Softplus的ONN的识别精度为96%,动量系数为0.9时,ONN的识别精度提高到96.9%;而加入动量的RMSprop算法会导致网络识别准确率不收敛或收敛较慢。
光学神经网络 马赫-曾德尔干涉仪 训练算法 动量 学习率 激光与光电子学进展
2023, 60(22): 2220001
东南大学仪器科学与工程学院,江苏 南京 210096
随着垃圾污染问题日益严重,垃圾自动检测识别具有越来越重要的应用价值。改进了YOLOv5算法,提升了对户外复杂背景下垃圾的检测性能,收集了6个类别的户外常见垃圾的图片,建立了一个背景复杂的垃圾图片数据集,提出了一种简单、高效的方法用于生成图片中垃圾目标物的简易真值热力图。基于YOLOv5网络,以真值热力图为量化标准,设计并实验得出一种用于生成垃圾目标物预测热力图的分支结构。随后,将预测热力图送回YOLOv5的backbone结构,增加目标检测网络前向传播过程中特征图的空间注意力权重,以提高整个目标检测网络的性能,改进后的网络仅增加了少量参数,生成了效果可观的预测热力图,垃圾检测的性能得到较大提升。
机器视觉 图像处理 目标检测 垃圾识别 神经网络训练 热力图 激光与光电子学进展
2023, 60(22): 2210002