1 内蒙古科技大学 信息工程学院,内蒙古包头市0400
2 内蒙古工业大学 信息工程学院,内蒙古呼和浩特010051
U型网络结构的脑肿瘤自动分割方法由于多次卷积和采样操作会造成信息损失,导致分割效果不佳。为解决这一问题,提出了能够利用语义信息流引导上采样特征恢复的特征对齐单元,并在此基础上设计轻量级的双重注意力特征对齐网络(DAFANet)。首先,将特征对齐单元分别引入3D UNet、DMFNet和HDCNet三个经典网络,以验证其有效性和泛化性。其次,在DMFNet基础上构造轻量级的双重注意力特征对齐网络DAFANet,利用特征对齐单元强化上采样过程中的特征恢复,3D期望最大化注意力机制同时作用于特征对齐路径和级联路径,用于重点获取上下文的全程依赖关系。同时使用广义Dice损失函数提升数据不平衡时的分割精度并加快模型收敛。最后,在BraTS2018和BraTS2019公开数据集进行验证,文中所提算法在ET,WT和TC区域的分割精度分别达到80.44%,90.07%,84.57%和78.11%,90.10%,82.21%。相较于当前流行的分割网络,具有对增强肿瘤区域更好的分割效果,更擅长处理细节和边缘信息。
脑肿瘤 图像分割 特征对齐 注意力机制 轻量化 brain tumors image segmentation feature alignment attention mechanism lightweight
中国人民解放军63870部队,陕西渭南714299
在可见光红外跟踪(RGB and Thermal Infrared Tracking,RGB-T)的研究中,为了在常规跟踪算法的基础上实现两个模态的有效融合,基于注意力机制提出了一种基于注意力交互的RGB-T跟踪算法。该算法引入注意力机制对可见光和红外两种模态的图像特征进行增强和融合,设计了自特征增强编码器对单一模态的特征进行增强,设计了互特征解码器对两个模态增强后的特征进行交互融合。编码器和解码器均采用两层注意力模块。为了减小算法模型的复杂度,对传统注意力模块进行简化,将全连接层改为1
![]()
![]()
1卷积。此外,该算法对多个卷积层的特征均进行分层融合,以充分挖掘各层卷积特征中的细节和语义信息。在GTOT,RGBT234和LasHeR三个数据集上进行对比测试。实验结果表明,所提算法性能优异,特别是在RGBT234和LasHeR这两个大规模数据集上取得了最优的跟踪结果,验证了注意力机制在RGB-T跟踪中的有效性。
可见光红外跟踪 注意力机制 多模态特征融合 特征增强 RGB-T tracking attention mechanism feature fuse of multi-modality feature enhancement
1 西安建筑科技大学 信息与控制工程学院,陕西西安70055
2 建筑机器人陕西省高等学校重点实验室,陕西西安710055
3 西安市建筑制造智动化技术重点实验室,陕西西安710055
针对混凝土表面裂缝分割过程中分割精度低、细微裂缝漏分和背景干扰等问题,提出一种联合线性引导和网格优化的裂缝分割模型。首先,在主干网络中引入多分支线性引导模块,通过自适应单维度池化增强网络对裂缝线性结构的表达能力,让不同区域的裂缝建立联系,增强全局上下文信息感知能力,提高网络分割精度;然后,提出网格细节优化模块,通过分区-优化-合并三步骤,将整个空间域划分为若干个空间网格,提取空间网格中的细微裂缝信息,防止细微裂缝漏分;最后,在主干网络的跳跃连接处嵌入混合注意力模块,在空间和通道双维度突出裂缝特征,减少背景干扰。在Deepcrack537,Crack500和CFD裂缝数据集上,所提模型的IoU值分别达到77.07%,58.96%和56.55%,F1-score值分别达到87.05%,74.19%和72.24%,明显优于大多数现有方法,具有更高的分割精度。
裂缝图像 线性引导 语义分割 网格优化 注意力机制 crack image linear guide semantic segmentation mesh optimization attention mechanism
烟台大学计算机与控制工程学院,山东 烟台 264000
现在大多数基于图卷积的点云语义分割方法忽略了边构建的重要性,不能充分地表示局部区域的特征。基于此,提出一种结合注意力机制的边增强的图卷积网络(AE-GCN)。首先,将邻居点特征加入边中,而不仅仅是中心点与邻居点的特征差异;其次,加入注意力机制保证点云的局部信息得到更充分的利用;最后,采用U-Shape的分割结构,确保网络更好适应点云的语义分割这一任务。在两个公开数据集Toronto_3D和S3DIS上的实验结果表明,与目前的大多数方法相比,AE-GCN取得了具有竞争力的结果:在Toronto_3D数据集的平均交并比为80.3%,总体准确度为97.1%;在S3DIS数据集的平均交并比为68.0%,总体准确度为87.2%。
三维图像处理 点云语义分割 注意力机制 边增强 图卷积 激光与光电子学进展
2024, 61(8): 0837009
1 重庆邮电大学工业物联网与网络化控制教育部重点实验室,重庆 400065
2 重庆邮电大学通信与信息工程学院,重庆 400065
针对室内可见光定位接收信号强度易出现波动从而产生较大定位误差,以及从一个定位单元迁移到其他定位单元可能会降低定位精度的问题,笔者提出了一种基于注意力机制的卷积神经网络的室内三维定位方法,以减小接收信号波动产生的影响,并采用迁移学习将在第一个定位单元中训练的网络迁移到其他定位单元中,在保证定位精度不变的前提下减少了训练网络的成本。仿真结果表明:所提算法在5 m×5 m×3 m的定位单元内可以实现平均误差为3.54 cm的三维定位;采用迁移学习将已训练网络部署到第二个定位单元中,可以实现平均误差为3.67 cm的定位。实验结果表明:在1.2 m×0.75 m×1.2 m的定位单元实验中,所提算法可以实现平均误差为3.32 cm的三维定位,90%的误差分布在4.12 cm内;采用迁移学习将已训练网络部署到第二个定位单元中,可以实现平均误差为3.35 cm的定位。与现有算法相比,所提算法迁移前后的定位精度均有所改善。
光通信 可见光定位 注意力机制 卷积神经网络 迁移学习
1 广西大学计算机与电子信息学院,广西 南宁 530004
2 广西大学机械工程学院,广西 南宁 530004
为了实时检测乘客的异常行为,提出一种基于YOLOv5s算法的轻量化自动扶梯乘客异常行为实时检测算法YOLO-STE。首先在主干网络中引入轻量化ShuffleNetV2网络,以减少主干网络的参数量和计算量;其次在骨干网络的最后一层引入基于Transformer编码的C3TR模块,以更好地提取丰富的全局信息和融合不同尺度的特征;最后在YOLOv5s的特征融合网络中嵌入SE(Squeeze-and-excitation)注意力机制,以更好地关注主要信息,从而提高模型精度。自建数据集并进行实验,实验结果表明,相比于原YOLOv5s,改进算法的全类平均精度值(mAP)高出1.9百分点,达到了96.1%,模型大小减少了70.8%。并且在Jetson Nano硬件上部署测试所得,改进后的算法前传耗时比原YOLOv5s模型缩短了39.9%。通过对比改进前后的算法,后者能更好地实现对自动扶梯乘客异常行为的实时检测,从而可以更好地保障乘客乘梯安全。
目标检测 轻量化 YOLOv5s ShuffleNetV2 C3TR模块 注意力机制 激光与光电子学进展
2024, 61(8): 0812004