作者单位
摘要
陕西科技大学 电子信息与人工智能学院,陕西 西安 710021
针对雾霾天气下车牌识别存在的精确度低、漏检等问题,提出了一种基于深度学习的雾霾天气下的车牌号码识别方法。首先用AOD-Net算法对车辆图像进行去雾预处理。然后,基于YOLOv5网络设计一种车牌检测网络ACG_YOLOv5s。ACG_YOLOv5s是在YOLOv5s网络的基础上,融入CBAM注意力机制,提高模型的抗干扰能力;引入自适应特征融合网络ASFF,根据模型自适应学习到的权重赋予网络不同特征层不同比重的权值,从而突出重要特征信息;使用Ghost卷积模块替换传统卷积,在保证模型效果的同时减少了网络训练过程中的参数量。最后通过LPRNet对检测到的车牌图像进行识别。实验结果表明,改进后的ACG_YOLOv5s网络车牌检测准确率达到99.6%,LPRNet识别准确率达96%且内存占比小。实验证明AOD-Net算法和YOLO算法结合可更加有效地检测雾霾天气下车牌图像中的车牌号码。
车牌号码识别 AOD-Net算法 YOLOv5网络 注意力机制 license plate number recognition AOD-Net algorithm YOLOv5 network attention mechanism 
液晶与显示
2024, 39(2): 205
杨泞滔 1,2聂勇 1,2
作者单位
摘要
1 中国科学院水利部成都山地灾害与环境研究所,成都 610299
2 中国科学院大学,北京 100049
冰湖溃决洪水是一种严重的山地自然灾害,威胁着中国高寒区的居民及铁路公路等重要基础设施,自动高效的冰湖遥感制图方法是冰湖灾害评估、监测预警的基础,然而现有自动制图方法在实际冰湖提取应用上难以达到传统人工和半自动冰湖提取方法上的精度,仍需进一步提高。文章在原生U-Net模型基础上,在各桥连接部分融合极化自注意力机制,将输入影像特征分别在空间和通道层保持高分辨率,并通过非线性合成输出细腻的特征,构建了一种改进的U-Net冰湖遥感深度学习制图方法,并将其成功应用在高原铁路关键区。研究结果表明:1)与PSPNet、DeepLabV3+、原生U-Net三种经典模型相比,改进模型在冰湖预测数据集上的各项指标上都有提升,精确率、召回率、交并比和F1值分别达到了0.972 5、0.966 5、0.940 8和0.969 4,相较于原生U-Net网络,精确度、召回率、交并比和F1值分别提高了5.01%、6.05%、10.73%和5.53%;2)基于Landsat-8卫星遥感数据,应用改进模型完成了2013—2022年帕隆藏布和易贡藏布案例区冰湖信息自动高效提取,如2020年冰湖总体精度为98.16%,与参照数据的重叠度达到96.66%,提取的精度满足冰湖灾害评估和监测预警研究需求,可用于铁路等重大工程沿线冰湖灾害防治的实践。
遥感监测 冰湖灾害 深度学习 自注意力机制 U-Net卷积神经网络 remote sensing monitoring glacial lake disaster deep learning self-attention mechanism U-Net 
航天返回与遥感
2024, 45(1): 41
陈果 1,2胡立坤 1,2,*
作者单位
摘要
1 广西大学电气工程学院,广西 南宁 530004
2 广西大学先进测控与智能电力研究中心,广西 南宁 530004
现有的U-Net虽然为遥感图像道路提取提供了较为理想的解决方案,但由于其缺乏对全局信息的关注,模型对于上下文信息的提取能力不足。为了进一步提高道路提取的准确度与完整度,提出一种结合上下文信息与多层特征融合的context&multilayer features-UNet(CMF-UNet),该模型利用金字塔特征聚合模块融合多层特征,并引入多尺度上下文信息提取模块用于加强上下文信息捕获能力。在Massachusetts Roads和CHN6-CUG两个数据集上进行实验验证,结果表明,所提方法能够有效提升道路分割精度,相较于原U-Net,CMF-UNet在Massachusetts Roads数据集上的召回率、F1 分数和交并比分别提升了5.77个百分点、2.02个百分点和2.62个百分点,在CHN6-CUG数据集上的召回率、F1分数和交并比分别提升6.47个百分点、1.53个百分点和2.04个百分点。
图像处理 U-Net模型 多尺度上下文 注意力机制 条带池化 
激光与光电子学进展
2024, 61(4): 0428007
张骏 1,2,3张鹏 1,2,3张政 1,2,3白云飞 1,2,3
作者单位
摘要
1 中航华东光电有限公司,安徽芜湖 241002
2 特种显示国家实验室,安徽芜湖 241002
3 国家特种显示工程技术研究中心,安徽芜湖 241002
热红外图像中的人体目标易于观察显著性强,应用广泛,但受限于热红外设备的硬件,往往图像中的人体目标边缘模糊,检测效果较差,同时因为热红外的特殊成像原理,人体目标检测时极易受到发热物和遮挡物的干扰,检测的精度也无法得到保证。针对上述问题,本文提出了一种类 HED(holistically nested edge detection)的热红外显著性人体检测网络。网络采用类 HED网络形式,通过将不同比例的空洞卷积编解码模块进行残差相加形式,完成人体目标的检测任务。实验证明该网络可以有效地检测人体目标,准确地预测边缘结构,同时在发热物及遮挡物等环境下也具有较高的检测精度。
HED HED, VGG, U-Net VGG U-NET 
红外技术
2023, 45(6): 649
作者单位
摘要
1 中国科学院长春光学精密机械与物理研究所,吉林 长春130033
2 中国人民解放军63618部队,新疆 库尔勒841000
目前采用U-Net结构的去模糊算法存在细节损失、图像质量欠佳等问题,因此对U-Net进行改进,提出一种基于多尺度优化和动态特征融合的图像去模糊方法。首先针对细节损失,提出一种精简且有效的多尺度残差注意力模块(Multi-Scale Residual Module, MSRM),通过增加特征尺度多样性来提取更精细的图像特征。此外,为了将更有利的特征传递到解码部分,在跳跃连接处设计动态特征融合模块(Dynamic Feature Fusion Module, DFFM),采用注意力加权的方式选择性融合不同阶段的编码特征。该算法采用多尺度内容损失和多尺度高频信息损失进行约束训练。在GoPro和RealBlur数据集上的实验结果表明,这种方法能有效改善图像质量,复原更丰富的细节信息。与现有去模糊算法相比,本文算法在主观视觉和客观评价等方面均具有一定优势。
图像去模糊 特征加权 多尺度特征 U-Net结构 image deblurring feature weighting multi-scale feature U-Net structure0 
红外
2023, 44(4): 0033
作者单位
摘要
天津理工大学,天津300382
红外图像技术在刑侦领域的应用越来越广泛。通过案发现场遗留的热痕迹可为案件搜集更多的证据。但是红外图像往往存在轮廓不清晰、提取效果模糊等问题。针对这些问题提出一种基于改进U-Net的图像目标提取方法。网络结构采用三层的上采样和下采样:上采样采用双立方插值,下采样采用步长为2的3×3卷积。通过跳跃连接将浅层特征和深层语义信息融合,并引入Dropout和Batch Normalization结构使得网络更快、更好地收敛。以刑侦红外手印为研究对象,通过实验对比改进U-Net、Sobel算子、分水岭、最大熵、Otsu等算法的图像目标提取效果。结果表明,本文搭建的U-Net网络能够更完整、更有效地提取红外手印的轮廓信息,在红外手印的提取上取得了较好的效果。
改进U-Net 手印红外图像 刑侦图像分割 improved U-Net fingerprint infrared image criminal investigation image segmentation 
红外
2023, 44(5): 0046
作者单位
摘要
长春师范大学 计算机科学与技术学院,吉林长春130032
为了解决编码器-解码器网络结构在目标提取中抑制无关语义、跨越语义鸿沟等问题,以获取更高精度,采用U-Net作为提取特征的主干网络;为了减轻浅层特征与深层特征语义的差异,设计一种融合注意力感知的多尺度语义池化模块(Channel-Spatial-Pyramid, CSP),替代早期层中的跳跃链接。CSP模块从空间与通道两个层面强调更有意义的语义信息,通过4个不同池化核的并行分支提取不同尺度特征,聚合所有分支结果与后期层特征拼接。实验结果表明,CSP-Net在彩色眼底图像视盘分割中的Dice指数可达99.6%,视杯分割结果的Dice指数为92.1%,相比现有算法均有提高。所提出的CSP-Net对于眼底图像中的微小目标提取的有效性及抗干扰性较高,可为青光眼筛查与诊断临床提借鉴。
多尺度语义 注意力感知 目标提取 U-Net multi scale semantics attention perception target extraction U-Net 
光学 精密工程
2023, 31(21): 3203
作者单位
摘要
广东工业大学 信息工程学院, 广东 广州 510006
针对现有医学图像分割模型存在着计算复杂度较高、参数量大,难以部署到实时医疗辅助诊断系统中,而现有的轻量化模型存在参数减小后导致分割性能下降等问题,提出了一种基于改进的轻量化U-Net分割模型。该模型由编码器、解码器和跳连接三个主要部分组成。编码器使用了由标准卷积和深度可分离卷积组合形成的多尺度融合模块,在此基础上,为增强神经网络学习能力,引入了瓶颈层结构,使用聚合方法设计出轻量级的跨级部分网络模块作为特征提取器对输入的图像进行特征提取; 在解码器中继续使用了该轻量级模块来进一步优化模型,降低模型的计算复杂度以及减少参数量,同时能够产生更好分割效果; 通过跳连接的方式实现编码器与解码器之间不同分辨率的特征信息融合。在腹部器官CHAOS和胸腔Chest X-ray数据集上进行实验,结果表明,改进型U-Net分割模型的参数量以及计算复杂度都得到了不同程度的降低,在模型参数量仅为1.28M的情况下,DSC分别为87.53%和95.85%,IOU分别为85.25%和92.21%,取得了不弱于其他网络的分割性能。
深度学习 医学图像分割 U-Net模型 轻量化 deep learning medical image segmentation U-Net model lightweight 
光学技术
2023, 49(5): 631
作者单位
摘要
1 昆明理工大学 信息工程与自动化学院, 云南 昆明 650500
2 昆明理工大学 云南省人工智能重点实验室, 云南 昆明 650500
视网膜血管的自动分割技术有助于早期诊断和治疗与视网膜相关的疾病。由于视网膜血管结构复杂且精细, 眼底图像存在着低对比度、光照不均以及病理性渗出物等因素的干扰, 导致该任务仍然具有挑战性。针对该任务主流框架U-Net中未考虑全局语义依赖关系以及编码器和解码器之间的语义鸿沟问题, 提出了一种同尺度和跨尺度增强的U-Net模型。从两个角度对该模型进行设计: 对于同一尺度的编码-解码层, 一种空间增强的自注意力机制被嵌入到每个编码层中以增强模型的全局空间聚合能力, 并进一步将其拓展到解码端来缓解解码过程中上采样操作带来的信息丢失等问题; 对于不同尺度的编码-解码层, 引入了一种新颖的跨尺度融合模块, 通过动态地选择最深层中丰富的特征信息来增强与其它层之间的语义交互, 从而进一步弥合编码器和解码器之间的语义鸿沟。在DRIVE、CHASE_DB1和STARE三个视网膜标准数据集上进行了实验验证, 实验结果表明I2A-Net能有效地分割出视网膜血管结构, 相比与基线模型, 在各项评价指标上均取得了较高的提升。
深度学习 视网膜血管分割 空间增强的自注意力机制 跨尺度融合模块 deep learning retinal vessel segmentation U-Net U-Net spatial enhanced self-attention mechanism cross-scale fusion module 
光学技术
2023, 49(4): 487
作者单位
摘要
空军工程大学装备管理与无人机工程学院, 西安 710000
针对“热保障”条件下飞机出动架次率难以测算的问题, 提出一种基于分层赋时着色Petri网(HTCPN)的飞机出动架次率仿真测算方法。首先, 根据飞机基层级维修保障工作, 建立飞机连续出动模型与保障流程; 其次, 运用Petri网理论和CPN tools软件, 构建基于HTCPN的机务保障全过程计算机仿真模型; 最后, 通过算例分析找出制约飞机出动架次率的重要影响因素。结果表明,所提方法不仅能够找出影响飞机出动的重要因素, 还能为飞机出动架次率测算提供技术支撑, 具有一定工程应用价值。
飞机出动架次率 分层赋时着色Petri网(HTCPN) 敏感性分析 仿真建模 aircraft sortie rate Hierarchical Timed Colored Petri Net (HTCPN) analysis of sensitivity simulation modeling 
电光与控制
2023, 30(12): 80

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!