1 北方民族大学 计算机科学与工程学院,宁夏银川75002
2 北方民族大学 图像图形智能处理国家民委重点实验室,宁夏银川75001
3 宁夏医科大学 医学信息与工程学院,宁夏银川750004
针对肺部X射线图像的病灶区域较小、形状复杂,与正常组织间的边界模糊,使得肺炎图像中的病灶特征提取不充分的问题,提出了一个面向特征增强的双残差Res-Transformer肺炎识别模型,设计3种不同的特征增强策略对模型特征提取能力进行增强。设计了组注意力双残差模块(GADRM),采用双残差结构进行高效的特征融合,将双残差结构与通道混洗、通道注意力、空间注意力结合,增强模型对于病灶区域特征的提取能力;在网络的高层采用全局局部特征提取模块(GLFEM),结合CNN和Transformer的优势使网络充分提取图像的全局和局部特征,获得高层语义信息的全局特征,进一步增强网络的语义特征提取能力;设计了跨层双注意力特征融合模块(CDAFFM),融合浅层网络的空间信息以及深层网络的通道信息,对网络提取到的跨层特征进行增强。为了验证本文模型的有效性,分别在COVID-19 CHEST X-RAY数据集上进行消融实验和对比实验。实验结果表明,本文所提出网络的准确率、精确率、召回率,F1值和AUC值分别为98.41%,94.42%,94.20%,94.26%和99.65%。DRT Net能够帮助放射科医生使用胸部X光片对肺炎进行诊断,具有重要的临床作用。
肺炎识别 X射线图像 特征增强 双残差结构 Transformer pneumonia recognition X-ray image feature enhancement dual residual model Transformer
南京林业大学土木工程学院,江苏 南京 210037
针对PointNet++在特征提取阶段未能深层挖掘Lidar点云的语义特征及其在特征聚合阶段采用最大池化聚合导致特征丢失,进而导致点云分割精度下降的问题,通过改进PointNet++的特征提取及特征聚合模块,提出一种基于特征偏差值和注意力机制的点云分割模型。首先,利用球形采样获取不同的局部邻域,并采用K最近邻(KNN)算法筛选邻域点,计算不同邻域的特征偏差值,获取点云的深层语义信息,增强模型对不同局部邻域的识别能力;其次,利用基于注意力机制的特征聚合模块代替PointNet++中的最大池化模块,在聚合特征阶段学习不同特征的权重,从而提高模型对不同结构信息的筛选能力,增强模型的分割性能;最后,为了进一步优化模型架构,在全连接层中加入残差模块,共享权重,避免参数冗余,提升模型性能。基于ISPRS提供的Vaihingen数据集与斯坦福的S3DIS数据集进行实验验证,实验结果表明,所提模型总体精度达到86.69%,较PointNet++提高了5.49个百分点,同时平均F1得分达到了73.97%,较PointNet++提高了8.30个百分点。在S3DIS数据集上的实验结果表明,与PointNet++、RandLA-Net和ConvPoint等主流模型相比,所提模型结果较PointNet++也有提升,即相较于PointNet++的分割结果,改进后的模型能够充分提取点云的语义特征,有效提高模型分割精度。
点云分割 PointNet++ Lidar 特征偏差值 注意力机制 特征融合 残差结构 激光与光电子学进展
2024, 61(4): 0411001
光学 精密工程
2023, 31(19): 2910
湖南科技大学计算机科学与工程学院,湖南 湘潭 411201
手术与化疗作为肝癌的主要治疗手段需要精确提取肝脏病变区域。针对目前肝肿瘤分割方法存在的小型肿瘤丢失、肿瘤边界分割模糊、分割严重错误等问题,提出一种融合注意力机制与残差可形变卷积的肝肿瘤分割方法。以U-Net为主干网络,在编码卷积层末尾增加一条带有反卷积与激活函数的残差路径,该路径与上层跳跃连接相连,解决池化与反卷积操作中的信息损失造成的小目标分割缺失与边界模糊问题;利用可形变卷积增强模型对肿瘤边界的特征提取能力;在跳跃连接层中添加一定数量的卷积层,弥补简单跳跃连接在特征融合时造成的语义空白;通过双注意力机制,模型更加关注肿瘤特征;采用混合损失函数,该函数在保证训练稳定的情况下解决类不平衡造成的分割性能下降的问题。在肝脏肿瘤公开数据集(LITS)上进行实验,所提方法的肿瘤分割Dice系数达85.2%,分割性能优于其他对比网络,能够达到辅助医疗诊断的要求。
肝癌 肿瘤分割 U-Net 残差结构 注意力 激光与光电子学进展
2023, 60(12): 1210001
1 桂林电子科技大学计算机与信息安全学院, 广西 桂林 541004
2 北京邮电大学人工智能学院, 北京 100876
3 北京邮电大学国际学院, 北京 100876
近红外光谱分析技术依赖于表征光谱向量和预测目标之间关系的化学计量学方法。 然而, 样品的光谱由信号和各种噪声组成, 传统化学计量学方法较难直接提取光谱的有效特征, 并为复杂的预测任务建立具有较强泛用性的校正模型。 进一步地, 受限于仪器间的差异, 在一台仪器上建立的模型应用于另一台仪器时, 难以取得相同的定量分析结果。 为此, 提出了一种基于卷积神经网络和迁移学习的定量分析建模及模型传递方案, 以提高模型在单仪器和跨仪器上的预测性能。 在卷积神经网络的基础上, 一种结合多尺度特征融合和残差结构, 名为MSRCNN的先进模型被设计, 并在主仪器上展现了卓越的预测能力。 然后, 设计了四种的基于fine-tune模型迁移策略, 将在主仪器上建立的MSRCNN模型迁移到从仪器。 在药品和小麦的公开数据集上的实验结果表明, MSRCNN在主仪器上的RMSE和R2分别为2.587, 0.981和0.309, 0.977, 优于PLS, SVM和CNN。 在利用30个从仪器的样本微调主仪器建立的模型后, 迁移MSRCNN中的卷积层和全连接层的方案取得了最好效果, 其RMSE和R2可分别达到2.289, 0.982和0.379, 0.965。 增加参与模型微调的从仪器样本, 可进一步提高性能。
近红外光谱 深度学习 迁移学习 多尺度融合 残差结构 模型传递 Near-infrared spectroscopy Deep learning Transfer learning Multi-scale fusion Residual convolution network Model transfer
天津大学电气自动化与信息工程学院,天津 300072
交通标志检测是自动驾驶系统的一项重要功能,当前先进的交通标志检测器大多采用Anchor-Based网络模型,根据锚框遍历所有潜在的目标位置。为了减少锚框带来的计算开销和过多的超参数设置,提出了一种基于编码-解码结构的Anchor-Free交通标志检测算法。为了增加解码模块的特征表征能力,在解码模块中引入残差增强分支。为了高效地提取和利用多尺度特征,设计了特征融合子网络,提升对多尺度目标的检测能力,并使用Ghost轻量化模块提取多尺度特征图,不显著引进运算量。在Tsinghua-Tencent 100K数据集上进行验证,所提算法实现了92.5%的召回率和90.3%的准确率,模型的参数量和模型大小分别为1.61×107和64.4 Mbit。实验结果表明,与主流目标检测算法相比,所提算法的检测精度较高,计算开销较低,在综合性能上具有优越性。
机器视觉 交通标志检测 Anchor-Free 残差结构 多尺度特征融合 激光与光电子学进展
2022, 59(24): 2415002
针对高光谱图像分类过程中存在的标记样本需求量大和分类精度要求高等问题,提出了一种利用残差生成对抗网络(GAN)的高光谱图像分类方法。该方法以生成对抗网络为基础,使用包含上采样层和卷积层构成的8层残差网络替换生成器的反卷积层网络结构,提高数据的生成能力,使用34层残差卷积网络替换判别器的卷积层网络结构,提高特征提取能力。以Pavia University、Salinas及Indian Pines数据集为实验数据,将所提方法与GAN、CAE-SVM、2DCNN、3DCNN、ResNet进行了比较。实验结果表明,所提方法在总体分类精度、平均分类精度和Kappa系数上均有显著提高,其中总体分类精度在Indian Pines数据集上达到了98.84%,较对比方法分别提高了2.99个百分点、22.03个百分点、12.91个百分点、4.99个百分点、1.79个百分点。所提方法在网络中加入残差结构,增强了浅层网络与深层网络的信息交流,可提取高光谱图像的深层次特征,提高了高光谱图像分类的精度。
图像处理 高光谱图像 分类 深度学习 生成对抗网络 残差结构 激光与光电子学进展
2022, 59(22): 2210008
1 贵州大学大数据与信息工程学院半导体功率器件可靠性教育部工程研究中心,贵州 贵阳 550025
2 中国科学院苏州纳米技术与纳米仿生研究所,江苏 苏州 215123
为充分提取高光谱图像(HSI)的光谱空间信息特征,实现HSI的高精度地物分类,提出端到端的多尺度特征融合残差(MFFI)模块。该模块结合了3D多尺度卷积、特征融合以及残差连接3种手段,实现了HSI多尺度光谱空间特征的联合提取。因模块具有端到端特性,可通过堆叠多个MFFI模块得到具有提取深层特征能力的MFFI网络。该网络在Salinas、Indian Pines和University of Pavia 3个HSI数据集的平均总体准确率为99.73%,平均准确率为99.84%,平均卡帕系数为0.9971。结果表明:MFFI模块可以有效提取不同类型地物数据集的光谱空间特征,并取得良好的分类结果。
高光谱图像分类 残差结构 多尺度特征融合 光谱空间特征提取 卷积神经网络 激光与光电子学进展
2022, 59(18): 1810014