1 北京理工大学光电学院,北京 100081
2 光电成像技术与系统教育部重点实验室,北京 100081
3 信息光子技术工业和信息化部重点实验室,北京 100081
注意力机制的出现和应用在一定程度上改善了神经网络对全局信息应用不足的缺陷,但常见的注意力机制模块也同样存在感受野小无法关注全局信息的问题,而某些全局注意力机制模块则计算成本过高。为此,提出一种基于卷积、池化、对比方法的轻量化注意力模块,即全局采样空间注意力模块。对于深度网络推理过程中部分模块输出的中间特征图,该注意力模块通过对比差值的形式获取所需要的空间注意力图。全局采样空间注意力模块是一种轻量化的通用模块,能够直接置入卷积神经网络中,增加的成本几乎可以忽略不计,并且其能够与网络一同进行端到端训练。主要在随机抽取的部分ImageNet-1K数据集和团队自制的“低慢小”无人机数据集中对模块进行了验证。实验结果显示,相比其他模块,所提模块在图像分类和小目标检测识别任务中具备1百分点~3百分点的性能提升效果,证明了所提模块的性能与其在小目标检测方面的适用性。
注意力机制 全局采样 轻量化 图像分类 小目标探测 激光与光电子学进展
2024, 61(10): 1037009
Author Affiliations
Abstract
1 College of Medical Instruments, Shanghai University of Medicine & Health Sciences, Shanghai 201318, P. R. China
2 School of Mechanical and Electrical Engineering and Automation, Shanghai University, Shanghai 200444, P. R. China
The electroencephalogram (EEG) rhythm and functional near-infrared spectroscopy (fNIRS) activation levels have not been compared between a healthy control group (HCG) and methamphetamine user group (MUG) with different addiction histories. This study used 64-electrode EEG and fNIRS to conduct an experiment that analyzed the resting and craving states. The EEG and fNIRS data of 56 participants were collected, including 14 healthy participants, 14 methamphetamine users with an addiction history of 0.5–5 years, 14 users with an addiction history of 5–10 years, and 14 users with an addiction history of 10–15 years. Isolated effective coherence (iCoh) within the brain network was used to process the EEG data. Statistical analysis was performed to compare differences in iCoh among the delta, theta, alpha, beta, and gamma bands and explore oxyhemoglobin activation levels in the ventrolateral prefrontal cortex, dorsolateral prefrontal cortex, orbitofrontal cortex, and frontopolar prefrontal cortex (FPC) of the control group. Finally, the Kmeans, Gaussian mixed model (GMM), linear discriminant analysis (LDA), support vector machine (SVM), Bayes, and convolutional neural networks (CNN) algorithms were used to classify methamphetamine users based on drug and neutral images. A 3-class accuracy was achieved. Changes in EEG and fNIRS activation levels of HCG and MUG with varied addiction histories were demonstrated.
Drug addiction history electroencephalogram functional near-infrared spectroscopy isolated effective coherence addiction history classification Journal of Innovative Optical Health Sciences
2024, 17(3): 2350029
强激光与粒子束
2024, 36(4): 043018
1 丽水市国土空间规划测绘研究院,浙江 丽水 323000
2 浙南综合工程勘察测绘院有限公司,浙江 杭州 310030
3 浙江省测绘科学技术研究院,浙江 杭州 311121
4 南京航空航天大学航天学院,江苏 南京 210016
针对全波形激光雷达和多光谱数据下土地覆盖误分类问题,提出了融合陆地卫星(Landsat)多光谱遥感影像数据和星载全波形激光雷达全球生态系统动态调查(GEDI)数据进行土地覆盖分类的方法。首先,根据实地调查数据建立数据集;然后,采用支持向量机(SVM)方法来实现激光雷达足迹的土地覆盖分类;最后,对土地覆盖的分类结果进行评价。结果表明,在SVM方法下联合使用光谱特征和波形特征的总体准确率可以达到90.68%,相比仅使用光谱特征或波形特征时总体准确率可以提升8个百分点以上。融合光谱特征和波形特征的方法可以提高土地覆盖分类的准确性。
测量 全球生态系统动力学调查 支持向量机 土地覆盖分类 Landsat
江苏大学电气信息工程学院,江苏 镇江 212013
激光点云技术可用于苗圃树木生长状态监测与管理,为农业植保机器人提供有效的靶标信息。为了进一步提高树种分类和树冠、树干内部分割的精准性,提出一种基于改进PointNet++的激光点云苗圃树木分类与分割方法。首先,调整PointNet++深度网络邻居点云的相对特征值,同时融合三维点云的低维和高维特征,充分利用各层级点云的特征。然后,将坐标注意力模块与注意力池化融合,进一步增强局部特征提取的能力,提高分类和分割的准确性。最后,针对苗圃常见树木自制了包含7类苗圃景观树木点云的数据集并用于实验。实验结果表明,提出的树种识别方法总体精度可达92.50%,平均类别精度为94.22%;提出的树冠、树干分割方法的平均交并比为89.09%。所提方法在分类和分割性能方面均明显优于经典的PointNet和PointNet++,能够为苗圃树木检测识别和农业机器人作业提供更精确的信息。
遥感 激光雷达 深度学习 树种分类 苗圃树木树冠和树干分割 PointNet++
1 厦门理工学院 电气工程与自动化学院,福建 厦门 361024
2 中国科学院 福建物质结构研究所,福建 福州 350108
3 中国科学院 海西研究院 泉州装备制造研究中心,福建 泉州 362000
4 厦门市高端电力装备及智能控制重点实验室,福建 厦门 361024
激光雷达数据由于其几何特性,被广泛应用于三维目标检测任务中。由于点云数据的稀疏性和不规则性,难以实现特征提取的质量和推理速度间的平衡。本文提出一种基于体柱特征编码的三维目标检测算法,以Pointpillars网络为基础,设计Teacher-Student模型框架对回归框尺度进行蒸馏,增加蒸馏损失,优化训练网络模型,提升特征提取的质量。为进一步提高模型检测效果,设计定位引导分类项,增加分类预测和回归预测之间的相关性,提高物体识别准确率。本网络所做改进没有引入额外的网络嵌入。算法在KITTI数据集上的实验结果表明,相比于基准网络,在三维模式下的平均精度值从60.65%提升到了64.69%,鸟瞰图模式下的平均精度值从67.74%提升到70.24%。模型推理速度为45 FPS,在提升检测精度的同时满足了实时性要求。
激光点云 三维目标检测 知识蒸馏 分类置信度 laser point cloud 3D object detection knowledge distillation classification confidence