上海理工大学 健康科学与工程学院上海介入医疗器械工程技术研究中心 教育部医学光学工程中心, 上海 200093
利用光学相干断层技术(OCT)产生的视网膜疾病图像是分类眼科疾病的重要措施。目的是利用四种不同分类模型的迁移学习方法对糖尿病黄斑水肿、老年性黄斑变性、玻璃疣三种病变的OCT视网膜图像进行自动分类, 实现迁移学习在OCT图像分类上的应用。将VGG-16、Inception V3、MobileNet V2、ShuffleNet-V2这四种神经网络模型在大规模图像分类数据集预训练好后, 进行模型微调和训练参数更新, 进而找到实现上述三种眼科疾病自动分类的最优模型, 达到高效的OCT视网膜病变自动分类效果。实验结果表明, 四种模型中轻量型MobileNet V2经模型微调后的评价指标优于其他模型。
光学相干断层图像 深度迁移学习 视网膜图像 模型微调 optical coherence tomography image deep transfer learning retina image model fine-tuning
华南理工大学 机械与汽车工程学院,广东广州510640
面向机器视觉检测鉴别的语义分割卷积神经网络(Convolutional Neural Network, CNN)模型能识别、测量被测对象的零部件、尺寸等特征,针对机器视觉检测鉴别增加识别零部件或关键部位的需求,以及进一步迁移学习会损失CNN模型部分权值的问题,提出一种基于标签预留Softmax算法的语义分割迁移学习技术。研究了机器视觉检测鉴别语义分割迁移学习建模方法,分析指出可尝试选定模型所有权值的微调迁移学习,有助于减小模型初始损失;提出了基于标签预留Softmax算法的微调迁移学习方法,可实现检测对象略有不同的模型所有权值微调迁移学习。在自建数据集上的实验表明,标签预留微调迁移学习技术训练模型达到机器视觉检测鉴别要求的时间由42.8 min减少到30.1 min,算法有效、效果明显;应用实验表明,迁移学习技术可实现标准件安装、漏装、误装情况检测与装配质量鉴别的半监督学习,新机箱迁移学习的训练时间不超过20.2 min,检测准确率达到100%,能满足机箱标准件装配质量检测鉴别的需求。
机器视觉 语义分割 迁移学习 卷积神经网络 微调 machine vision semantic segmentation transfer learning convolutional neural network(CNN) fine-tuning
四川大学 材料科学与工程学院, 四川 成都 610064
石英晶体谐振器(QCR)是现代电子行业领域中一种不可缺少的电子元器件。通过计算并沉积不同形状及厚度的电极在具有某一基准频率的石英晶片上, 即可得到所需目标频率。受镀膜设备、掩膜板、晶体尺寸及镀膜位置等因素的影响, 很难精确地一次性得到目标频率, 特别是对于批量生产的石英谐振器, 要获得一致性很好的频率更难, 因此, 后期的频率微调很重要。频率微调法包括物理法和化学法, 一般通过改变石英晶片或电极的质量来实现升频或降频。该文首先综述了激光刻蚀和离子束刻蚀物理法升频技术, 然后结合相关技术的发展, 在论证可行性的基础上, 创新性地提出使用磁控溅射技术进行升频微调, 并建立了理论模型。
电极 磁控溅射 升频微调 石英晶体谐振器 electrode magnetron sputtering trimming frequency upward quartz crystal resonator
空军航空大学 航空作战勤务学院,吉林 长春 130022
针对航空面阵遥感图像拼接算法一般存在误差累积的问题,提出了航空面阵图像拼接的累积误差消除方法。首先,利用航空遥感平台位置信息与姿态信息完成每幅图像投影变换与粗拼接,确保了每幅投影变换后图像拼接误差的独立性,从而避免了误差累积现象;然后,采用SIFT算法提取粗拼接相邻图像重叠区域的同名像点对,并根据同名像点对的位置差异,按照误差均分的原则,逐张独立地进行坐标微调及坐标精调,直到满足一定精度为止,以提高图像拼接精度,同时避免坐标调整时产生的误差累积。最后,通过主观评价(对比校正后卫星图像和文中拼接效果图像的地理对应关系)和客观评价(SSIM算法)对图像拼接质量进行评价。理论分析与实验结果表明:该方法能有效规避图像拼接中的误差累积问题,相对当前主要拼接方法,能够很好地与地理空间二维坐标保持一致性,且具有很好的实用价值和应用前景。
图像拼接 无误差累积 误差均分 坐标微调 image stitching error-free cumulative average error coordinate fine-tuning 红外与激光工程
2021, 50(9): 20200529
红外与激光工程
2021, 50(6): 20210087
1 福州大学机械工程及自动化学院, 福建 福州 350108
2 福建医科大学附属第一医院, 福建 福州 350005
光学相干断层扫描是目前检测糖尿病视网膜黄斑病变较为灵敏的方法之一,但病变的人工判断易产生主观失误,且比较耗时。为此,本文在迁移学习的基础上提出了一种改进的深度学习网络,用于视网膜图像的自动分类。先基于自适应阈值联合高斯滤波算法对图像进行预处理;然后以预训练模型为基础,通过微调解决样本差异的问题,并以全局平均池化方法替代传统的全连接层来提取深层特征,以降低网络的过拟合现象。基于实验数据对该网络进行验证,所提网络对视网膜病变图像的分类准确率可达97.3%,说明了所提网络对视网膜黄斑病变图像自动分类的有效性。
医用光学 光学相干断层扫描 迁移学习 高斯滤波 微调 全局平均池化 激光与光电子学进展
2021, 58(1): 0117002
山东大学(威海)机电与信息工程学院, 山东 威海 264209
矮新星是一类特殊而稀少的半相接双星。 发现更多的矮新星对于深入研究物质转移理论、 理解密近双星演化过程意义深远。 利用深度学习技术提取天体光谱特征并进而分类是天文数据处理领域的研究热点。 传统的自编码器是仅包含一个隐层的经典神经网络模型, 编码能力有限, 数据表征学习能力不足。 模块化拓宽神经网络的深度能够驱使网络继承地学习到天体光谱的特征, 通过对底层特征的逐渐抽象学习获得高层特征, 进而提高光谱的分类准确率。 以自编码器为基础构建了由输入层、 若干隐藏层和输出层组成的基于多层感知器架构的深度前馈堆栈式自编码器网络, 用于处理海量的光谱数据集, 挖掘隐藏在光谱内部具有区分度的深度结构特征, 实现对矮新星光谱的准确分类。 鉴于深度架构网络的参数设置会严重影响所构建网络的性能, 将网络参数的优化分为逐层训练和反向传播两个过程。 预处理后的光谱数据先由输入层进入网络, 再经自编码器算法和权值共享实现对网络参数的逐层训练。 反向传播阶段将初始样本数据再次输入网络, 以逐层训练所得的权值对网络初始化, 再把网络各层的局部优化训练结果融合起来, 根据所设置的输出误差代价函数调整网络参数。 反复地逐层训练和反向传播, 直到获得全局最优的网络参数。 最后由末隐层作为重构层搭建支持向量机分类器, 实现对矮新星的特征提取与分类。 网络参数优化过程中利用均值网络思想使网络隐层单元输出按照dropout系数衰减, 并由反向传播算法微调整个网络, 从而防止发生深度过拟合现象, 减少因隐层神经元间的相互节制而学习到重复的数据表征, 提高网络的泛化能力。 该网络分布式的多层次架构能够提供有效的数据抽象和表征学习能力, 其特征检测层可从无标注数据中隐式地学习到深度结构特征, 有效刻画光谱数据的非线性和随机波动性, 避免了光谱特征的显式提取, 体现出较强的数据拟合和泛化能力。 不同层之间的权值共享能够减少冗余信息的干扰, 有效化解传统多层次架构网络易陷入权值局部最小化的风险。 实验表明, 该深度架构网络在矮新星分类任务中能达到95.81%的准确率, 超过了经典的LM-BP网络。
反向传播 微调 深度架构 Back propagation Fine tuning Deep architecture
为了有效利用高光谱遥感图像中的波段信息,提高高光谱遥感图像分类的精确度,本文提出了基于栈式自编码神经网络( Stacked Autoencoder,SA)对高光谱遥感图像进行分类。栈式自编码神经网络充分利用高光谱图像中的光谱信息,对其进行相应特征提取,避免了相邻信息间的相关性和信息的冗余,本方法采用无监督学习和监督学习相结合,既可以像传统方法那样进行降维,简化相关的计算复杂度,同时在分类精度上有很大地提高。
栈式自编码神经网络 高光谱图像 光谱特征 微调 stack self-encoding neural network hyperspectral image spectral feature fine-tuning