作者单位
摘要
1 南京航空航天大学 民航学院,江苏 南京 211106
2 光电信息控制和安全技术重点实验室,天津 300308
从热红外图像对比度低、细节信息不足等特点出发,提出了一种面向热红外图像的景深估计方法。首先,设计了一种红外特征聚合模块,提高了对目标物边缘和小目标的全方位深度信息获取能力;其次,在特征融合模块中引入了通道注意力机制,进一步融合通道间的交互信息;在此基础上,建立了一种深度估计网络,实现热红外图像的像素级景深估计。消融实验与对比实验的结果表明,该方法在热红外图像像素级景深估计中性能优于其他代表性方法。
红外图像 无监督学习 单目深度估计 特征聚合 通道注意力机制 thermal infrared image self-supervised learning monocular depth estimation feature aggregation channel attention mechanism 
红外与毫米波学报
2023, 42(6): 906
作者单位
摘要
1 天津大学微电子学院,天津 300072
2 天津大学智能与计算学部,天津 300072
3 天津市成像与感知微电子技术重点实验室,天津 300072
针对无人机航摄图像中目标尺寸差异大导致的感受野难以同时兼顾不同尺寸物体分割效果的问题,提出了利用两路分支分别提取浅层和深层信息的双路特征融合网络(DSFA-Net)。在编码器中,浅层分支利用三个串行ConvNeXt模块提取高通道数的浅层特征以保留更多空间细节;深层分支利用坐标注意力空洞空间金字塔池化(CA-ASPP)模块为特征图重新分配权重,使网络更加关注尺寸各异的分割目标,获得深层多尺度特征。在解码过程中,网络利用双边引导融合模块为两层特征建立通信以进行分辨率融合,提高层级特征的利用率。所提方法在AeroScapes和Semantic Drone航摄图像数据集上进行了实验,其平均交并比分别达到83.16%和72.09%、平均像素准确率分别达到90.75%和80.34%。与主流的语义分割方法相比,所提方法对于具有较大尺寸差异的目标,分割能力更强,更适用于无人机航摄图像场景下的语义分割任务。
语义分割 特征融合 双路网络 坐标注意力空洞空间金字塔池化 多尺度特征提取 semantic segmentation feature aggregation dual-stream architecture coordinate attention atrous spatial pyramid pooling multi-scale feature extraction 
激光与光电子学进展
2023, 60(24): 2428005
倪康 1,2,*翟明亮 3王鹏 4
作者单位
摘要
1 南京邮电大学计算机学院、软件学院、网络空间安全学院,江苏 南京 210023
2 江苏省大数据安全与智能处理重点实验室,江苏 南京 210023
3 南京邮电大学自动化学院、人工智能学院,江苏 南京 210023
4 南京航空航天大学电子信息工程学院,江苏 南京 211106
提出一种小波-空间高阶特征聚合网络(WHFA-Net),该网络可分为小波域特征提取和空间域特征提取两个分支。首先,将Harr小波变换嵌入卷积神经网络(CNNs),保留深度卷积特征的低频分量作为小波深度特征;其次,利用最大池化进行深度特征学习,并将其输出作为空间深度特征;将两分支的深度特征进行向量化后,获取其自相关和互相关高阶深度特征向量,并依次进行特征正规化、特征聚合和特征归一化操作;最后,引入交叉熵损失函数进行端到端网络训练。在NWPU45(NWPU-RESISC45 Dataset)和AID(Aerial Image Dataset)数据集上的实验结果表明:相较于基准网络(VGG-16),本文所提WHFA-Net的场景分类准确率有5.13%~12.12%的提升;与DCCNN、APDC-Net、GBNet、LCNN-BFF、MSCP和Wavelet CNN相比,WHFA-Net的场景分类准确率均有不同程度的提升;通过消融实验验证了各模块和分支的有效性及其性能差异。因此,WHFA-Net可有效且稳定地抽取遥感场景图像不同特征域的高阶聚合特征,并提升场景分类准确率。
遥感 场景分类 卷积神经网络 特征可辨别性 特征聚合 remote sensing scene classification convolutional neural network feature discriminability feature aggregation 
光学学报
2022, 42(24): 2428005
作者单位
摘要
1 石家庄铁道大学 交通工程结构力学行为与系统安全国家重点实验室, 石家庄 050043
2 石家庄铁道大学 电气与电子工程学院, 石家庄 050043
3 河北省疾病预防控制中心, 石家庄 050021
为了提高室外场景中车载激光雷达道路不平度信息检测的精度, 采用随机降采样和局部特征聚合的网络结构对道路环境信息进行提取分割。在分割过程中加入随机降采样的方法, 从而提高点云信息的计算效率, 为解决道路环境信息分割过程中关键特征丢失的问题, 加入局部特征聚合器来增加每个3维点云的接受域来保留几何细节。结果表明, 所提出的算法可以准确识别道路环境信息, 对于凸包、凹坑、道路可行驶区域的识别精度分别达到71.87%, 82.71%, 93.01%, 与传统卷积神经网络相比有显著提升。该研究可高效提取道路不平度及道路可行驶区域信息, 从而提高了车辆的主动安全性与平顺性。
激光技术 随机降采样 局部特征聚合 点云 laser technique random down sampling local feature aggregation point cloud 
激光技术
2022, 46(5): 624
李瑞龙 1,2吴川 1,2,*朱明 1,2
作者单位
摘要
1 中国科学院 长春光学精密机械与物理研究所,吉林 长春 130033
2 中国科学院大学,北京 100049
基于激光雷达点云数据的三维目标检测算法受制于数据量大,无法实现速度与准确率的平衡。本文提出一种改进的三维目标检测算法Pillar RCNN。首先将目标点云空间划分为体素格,使用一种基于稀疏卷积的三维主干网络将体素格逐步转化为立柱体素,三维信息量化为致密的二维信息。然后使用二维主干网络提取特征,同时将三维骨干网络中不同尺度的体素特征与二维主干网络通过多尺度体素特征聚合模块进行特征级联,通过损失函数进一步细化检测框。算法在KITTI公开数据集上进行测试,在RTX 2080Ti硬件平台上识别速度为2.48 ms。汽车、行人、自行车3种类别的检测效果同PointPillars基准算法相比较,其中自行车中等难度检测效果提升13.34%,困难难度的车检测效果提升8.85%,其他类别的检测准确率指标也有所提升,实现了速度与准确率的平衡。
计算机视觉 三维目标检测 体素 稀疏卷积 特征聚合 computer vision 3D detection voxel sparse convolution feature aggregation 
液晶与显示
2022, 37(10): 1355
作者单位
摘要
1 兰州交通大学 测绘与地理信息学院,甘肃兰州730070
2 兰州交通大学 自动化与电气工程学院,甘肃兰州730070
为准确捕捉三维点云模型的上下文信息,提高分割准确率,提出一种利用模型相似性进行三维模型簇协同分割的方法。首先,对点云模型进行最远点采样得到质心点,并采用球内随机选取的方式确定邻域点以构建球形邻域;然后,使用特征聚合算子编码三维点云之间的几何拓扑关系,提取各邻域间的相关联特征,并利用各球形邻域的质心坐标构建空间相似性矩阵,由空间相似性矩阵对编码器网络所提取的模型局部特征进行加权求和,完成对三维模型的协同分析;最后,搭建分层特征提取网络对经过加权处理的关联特征进行解码操作,完成模型簇协同分割任务。实验结果表明,本文算法在ShapeNet Part数据集上的协同分割准确率达到了86.0%。与kNN算法相比,以球内随机选取法为邻域点采样策略,可使网络的分割准确率提升0.8%;相比于使用共享的多层感知机进行特征提取,使用特征聚合算子进行卷积运算可使网络的分割准确率提高12.9%;与当前主流的模型分割算法相比,本文算法的分割准确率得到了进一步的提升。
协同分割 特征聚合算子 空间相似性矩阵 模型簇 分层编-解码器 co-segmentation feature aggregation operator spatial similarity matrix shape clusters layered codec 
光学 精密工程
2021, 29(10): 2504

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!