作者单位
摘要
1 辽宁工程技术大学 软件学院,辽宁 葫芦岛 125000
2 中国科学院 海西研究院 泉州装备制造研究中心,福建 泉州 362000
3 厦门理工学院 电气工程与自动化学院,福建 厦门 361024
针对编解码语义分割网络计算量大、解码结构复杂的问题,提出一种高效无解码的二值语义分割模型DFNet。该模型首先去除主流分割网络中复杂的解码结构和跳跃连接,采用卷积重塑上采样方法重塑特征编码直接得到分割结果,简化网络模型结构;其次在编码器中融合轻量双重注意力机制EC&SA,提高特征编码的通道及空间信息交互,增强网络的编码能力;最后使用PolyCE损失替代常规分割损失,解决正负样本不均衡问题,提高模型的分割精度。在DeepGlobe道路分割和CrackForest缺陷检测等二值分割数据集上的实验结果表明,本文模型的分割精度F1均值和IoU均值分别达到84.69%和73.95%,且分割速度高达94 FPS,远超主流语义分割模型,极大地提高了分割任务效率。
二值分割 卷积重塑上采样 EC&SA PolyCE 道路分割 缺陷检测 binary segmentation convolution remolding upsampling EC&SA PolyCE road segmentation defect detection 
液晶与显示
2024, 39(2): 121
作者单位
摘要
1 黔西南州自然资源管理服务中心,兴义 562400
2 贵州大学矿业学院,贵阳 550025
针对传统喀斯特地区裸岩提取方法成本高、精度低的问题,文章构建了一种基于改进DeepLabV3+的裸岩提取方法。该方法首先在编码器中用CA-DC-MobileNetV3替换DeepLabV3+骨干网络Xception进行特征提取,很大程度上减少了模型的参数量;其次,将编码器提取的特征通过特征金字塔网络和坐标注意力机制进行加强特征提取,以获取更多小目标信息并减少图像细节损失;最后在空洞空间金字塔池化模块将不同空洞率的卷积层进行特征融合,提高信息的利用率。研究结果表明:文章方法在不同场景裸岩提取任务中表现最好,模型参数量约为DeepLabV3+的1/13,交并比、F1分数分别为72.46%、84.03%,上述2个指标相比于DeepLabV3+模型分别提高了4.62和3.19个百分点,并优于其余常用语义分割模型,提高了裸岩提取精度。
裸岩提取 深度学习 语义分割 坐标注意力机制 bare rock extraction deep learning semantic segmentation coordinate attention mechanism 
航天返回与遥感
2024, 45(1): 123
作者单位
摘要
北京航空航天大学 电子信息工程学院,北京 100191
光学下变频技术可将宽频带内全部电磁信号同时下变频到低频区间进行接收,是一种新型宽频带电磁环境快速接收技术。但是,获取的光学下变频信号中包含源个数未知、带宽不同的多种信号,现有信号分离方法需要获知源信号的个数,且无法同时分离窄带信号和宽带信号。为实现对光学下变频信号的自动分离,提出了一种基于变分模态分解(VMD)自适应模态重组的光学下变频信号分离方法。通过频谱分割因子和频谱包络检测,对光学下变频信号的VMD过分解模态进行自动重组和信号重组模态提取,实现光学下变频信号分离。对于包含普通脉冲信号、宽带码分多址(WCDMA)信号和线性调频脉冲信号的光学下变频信号,可自动实现对三种信号的分离,且与原信号的相似系数均高于0.97。实验结果表明,所提及方法在分离光学下变频信号时无需获知源信号的个数,并能同时分离具有不同带宽的多种源信号。
变分模态分解 光学下变频 单通道信号分离 频谱分割因子 频谱包络检测 variational mode decomposition optical down-conversion single channel signal separation spectrum segmentation factor spectrum envelope detection 
强激光与粒子束
2024, 36(4): 043020
作者单位
摘要
1 江苏理工学院 机械工程学院,江苏常州2300
2 常州祥明智能动力股份有限公司,江苏常州13011
在QFN芯片封装缺陷检测中,增加图像分割环节可有效提高缺陷检测准确性与检测效率。针对图像分割中传统算法效率低、智能优化算法分割精度低稳定性差的问题,本文提出一种基于改进灰狼优化算法(IGWO)的图像多阈值分割方法。首先,改进原始灰狼优化算法非线性因子,平衡算法搜索效率与挖掘能力;其次,引入反向学习策略提高种群整体质量,引入正弦函数、调整头狼权重以改进灰狼更新策略,增强算法多样性与挖掘能力;然后,提出头狼靠拢与种群变异交替进行的位置更新策略,平衡算法收敛性能与跳出局部最优能力;最后,以Kapur熵为适应度函数,求解最优分割阈值。将本文提出的改进灰狼优化算法的多阈值图像分割方法,与灰狼优化算法(GWO)、基于翻筋斗觅食策略的灰狼优化算法(DSF-GWO)、基于莱维飞行的樽海鞘群优化算法(LSSA)、改进北方苍鹰算法(INGO)的图像分割方法进行实验对比,结果表明:本文方法在分割用时方面,约为DSF-GWO的1/2,INGO的1/4;在分割精度与稳定性方面,在进行QFN芯片缺陷图像的连续30次分割时,本文方法具有最大Kapur熵平均值、最小标准差与最短分割时间。因此本文方法可实现高精度、高稳定性与高效率的QFN芯片图像多阈值分割。
灰狼优化算法 多阈值分割 Kapur熵 QFN Grey Wolf Optimization(GWO) multi-threshold segmentation Kapur entropy Quad Flat No-lead package(QFN) 
光学 精密工程
2024, 32(6): 930
作者单位
摘要
1 江苏科技大学 计算机学院, 江苏镇江22000
2 南京大学 计算机软件新技术国家重点实验室, 江苏南京10046
为了提高动态场景RGB-D SLAM中相机位姿精度,基于实例分割与光流算法,提出一种高精度RGB-D SLAM方法。首先,通过实例分割算法检测出场景中的物体,删除非刚性物体并构造语义地图。接着,通过光流信息计算运动残差,检测场景中动态刚性物体,并在语义地图中追踪这些动态刚性物体。然后,删除每一帧中非刚性物体和动态刚性物体上的动态特征点,利用其他稳定的特征点优化相机位姿。最后,通过TSDF模型重建静态背景,并以点云的形式显示动态刚性物体。在TUM和Bonn数据集中测试表明,本文方法与当前最先进的SLAM工作ACEFusion相比相机精度提升约43%。消融实验结果表明,保留动态刚性物体处于静止状态下的特征点对相机位姿估计结果提升约37%。稠密建图实验结果表明,本文方法在动态场景中重建结果优于当前先进的工作,平均重建误差为0.042 m。代码开源在https://github.com/wawcg/dy_wcg
动态场景 同步定位与地图构建 实例分割 光流 dynamic scenes SLAM instance segmentation optical flow 
光学 精密工程
2024, 32(6): 857
光电工程
2024, 51(1): 230304
陈琪 1,2秦芝宝 1,2蔡晓誉 1,2李世杰 1,2[ ... ]邰永航 1,2,*
作者单位
摘要
1 云南师范大学物理与电子信息学院,云南 昆明 650500
2 云南省光电信息技术重点实验室,云南 昆明 650500
构建了一种基于自监督的框架,该框架从单目立体内窥镜视频中提取多视图图像,利用图像中的底层三维(3D)信息构建对象的几何约束,实现软组织结构的准确重建。基于分割任意场景模型对内窥镜下的动态手术器械、静态腹腔场景及可形变软组织结构进行分割解耦。该框架利用简单的神经网络多层感知机来表示动态神经辐射场(NeRF)中运动手术器械和形变软组织结构,基于偏斜熵损失对手术场景中的手术器械、腔体场景和软组织结构进行正确分离。在通过使用单目立体内窥镜捕获机器人手术模拟器场景的数据集上,将所提方法的结果与其他方法进行定量定性比较。结果表明本文方法在处理腹腔体场景、软组织结构重建、手术器械的分割解耦,以及来自多视点的3D信息和运动对象的图像分割等方面显著优于当前的方法。
视觉光学 神经辐射场 软组织三维重建 分割任意场景模型 分割解耦 
光学学报
2024, 44(7): 0733001
作者单位
摘要
1 鲁东大学信息与电气工程学院,山东 烟台 264025
2 烟台理工学院信息工程学院,山东 烟台 264003
3 山东大学软件学院,山东 济南 250014
图像分割是计算机视觉领域的重要研究方向。模糊聚类方法由于其无监督的特性,在图像分割中得到了广泛的应用。然而,传统的模糊聚类方法在处理含高强度噪声和复杂形状的图像时,往往分割效果不理想。为了解决这一问题,提出了一种基于显著性检测的权重因子,用于构建加权滤波器和像素相关性模型,从而提高算法的抗噪能力。所提加权滤波器在结构相似性上比传统滤波器的最优结果高出0.1。此外,引入核度量以适应复杂图像的分割需求。在合成图像、自然图像、遥感图像和医学图像上进行了大量实验,结果表明,所提算法在视觉效果上优于传统方法,并且在分割精度上比传统方法的最优结果高出2%。
图像分割 模糊聚类 加权滤波 核度量 像素相关性 
激光与光电子学进展
2024, 61(8): 0837005
作者单位
摘要
西安邮电大学 通信与信息工程学院,陕西西安710121
由于卷积操作的局限性,现有的皮肤病变图像分割网络无法对图像中的全局上下文信息建模,导致其无法有效捕获图像的目标结构信息,本文设计了一个融入交叉自注意力编码的U型混合网络,用于皮肤病变图像分割。首先,将设计的多头门控位置交叉自注意力编码器引入到U型网络的最后两个层级中,使其能够在图像中学习语义信息的长期依赖关系,弥补卷积操作全局建模能力的不足;其次,在跳跃连接部分引入一个新的位置通道注意力机制,用于编码融合特征的通道信息并保留位置信息,提高网络捕获目标结构的能力;最后,设计一个正则化Dice损失函数,使网络能够在假阳性和假阴性之间权衡,提高网络的分割结果。基于ISBI2017和ISIC2018数据集的对比实验结果表明,本文网络的Dice分别为91.48%和91.30%,IoU分别为84.42%和84.12%,分割精度在整体上优于其他网络,且具有较低的参数量和计算复杂度,即本文网络能够高效地分割皮肤病变图像的目标区域,可为皮肤疾病辅助诊断提供帮助。
医学图像分割 皮肤病变 交叉自注意力编码 位置通道注意力 medical image segmentation skin lesion cross-self-attention coding position channel attention 
光学 精密工程
2024, 32(4): 609
作者单位
摘要
1 内蒙古科技大学 信息工程学院,内蒙古包头市0400
2 内蒙古工业大学 信息工程学院,内蒙古呼和浩特010051
U型网络结构的脑肿瘤自动分割方法由于多次卷积和采样操作会造成信息损失,导致分割效果不佳。为解决这一问题,提出了能够利用语义信息流引导上采样特征恢复的特征对齐单元,并在此基础上设计轻量级的双重注意力特征对齐网络(DAFANet)。首先,将特征对齐单元分别引入3D UNet、DMFNet和HDCNet三个经典网络,以验证其有效性和泛化性。其次,在DMFNet基础上构造轻量级的双重注意力特征对齐网络DAFANet,利用特征对齐单元强化上采样过程中的特征恢复,3D期望最大化注意力机制同时作用于特征对齐路径和级联路径,用于重点获取上下文的全程依赖关系。同时使用广义Dice损失函数提升数据不平衡时的分割精度并加快模型收敛。最后,在BraTS2018和BraTS2019公开数据集进行验证,文中所提算法在ET,WT和TC区域的分割精度分别达到80.44%,90.07%,84.57%和78.11%,90.10%,82.21%。相较于当前流行的分割网络,具有对增强肿瘤区域更好的分割效果,更擅长处理细节和边缘信息。
脑肿瘤 图像分割 特征对齐 注意力机制 轻量化 brain tumors image segmentation feature alignment attention mechanism lightweight 
光学 精密工程
2024, 32(4): 565

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!