徐胜军 1,2杨华 1,2,*李明海 1刘光辉 1,2[ ... ]韩九强 1,2
作者单位
摘要
1 西安建筑科技大学 信息与控制工程学院,陕西 西安 710055
2 西安市建筑制造智动化技术重点实验室,陕西 西安 710055
深度学习 图像增强 傅里叶变换 小波变换 双域融合 注意力机制 deep learning image enhancement fourier transform wavelet transform dual-domain convergence attention mechanism 
光电工程
2024, 50(12): 230225
作者单位
摘要
1 西安建筑科技大学信息与控制工程学院,陕西 西安 710055
2 西安交通大学自动化科学与工程学院,陕西 西安 710049
为解决工厂流水线上不同种类动态物品的快速精准抓取问题,提出一种两阶段动态多物品定位抓取方法。第1阶段采用所提多尺度上下文感知的单分支融合语义分割网络获取目标物品的掩码区域:首先特征提取网络采用单分支结构,在保证提取丰富的空间信息和高层语义信息的同时,减小网络参数量;随后特征融合网络通过双边引导特征融合模块增强空间信息和语义信息的表达能力;最后设计特征增强网络,通过特征辅助收敛模块嵌入浅层和深层网络中,加快网络收敛速度。第2阶段采用基于轮廓点检测的快速位姿估计策略在掩码区域预测最佳抓取点位姿。在自建数据集上的测试及流水线平台抓取实验结果表明,所提方法能实时检测和预测物品抓取点位姿,精准完成物品抓取,其分割精度、预测时间和抓取成功率均优于对比方法。
机器视觉 机器人抓取 两阶段定位抓取算法 多尺度上下文感知 特征增强 位姿估计 
激光与光电子学进展
2023, 60(6): 0615005
徐胜军 1,2,2张若暄 1,2,2,*孟月波 1,2,2刘光辉 1,2,2韩九强 1
作者单位
摘要
1 西安建筑科技大学 信息与控制工程学院,陕西西安70055
2 西安市建筑制造智动化技术重点实验室, 陕西西安710055
针对遥感图像建筑物易受背景中道路、树木、阴影干扰而导致分割边界不清晰的问题,提出了一种融合分形几何特征的Resnet网络。所提模型基于编码-解码框架,以Resnet网络为主干网络,在编码阶段中引入融合分形先验的空洞空间金字塔池化模块(FD-ASPP),利用分形维数捕获遥感图像的分形特征,增强了Resnet网络的几何特征描述能力。解码阶段提出一种深度可分离卷积注意力融合机制(DSCAF),有效融合高层次特征和低层次特征,获取更加丰富的遥感图像语义信息和位置细节信息。在WHU遥感图像数据集上的实验表明,精确率达到0.944 8,召回率达到0.946 2,F1分数达到0.945 5,平均交并比mIoU达到0.941 5。所提模型与FCN、Segnet、Deeplab V3、U-net、SETR和AlignSeg等现有建筑物遥感语义分割模型相比,具有更好的分割精度,有效克服了道路、树木、阴影等因素的干扰,得到了较清晰的建筑物边界。
遥感图像 建筑物分割 残差网络 分形维数 特征融合 remote sensing image building segmentation Resnet fractal dimension feature fusion 
光学 精密工程
2022, 30(16): 2006
作者单位
摘要
1 西安建筑科技大学信息与控制工程学院,陕西 西安 710055
2 人工智能与数字经济广东省实验室(广州),广东 广州 510320
针对自然场景下混凝土裂缝背景复杂、纹理多变所造成的裂缝分割不准确问题,提出了一种基于特征增强整体嵌套网络裂缝检测算法。首先,在整体嵌套网络,一种深度学习边缘检测网络的基础上,采用多尺度监督机制融合不同尺度混凝土裂缝的预测结果,增强网络对混凝土裂缝线性拓扑结构的表达能力;然后,采用一种卷积-反卷积特征融合模块将混凝土裂缝的反卷积深层语义特征和卷积浅层细节特征有效融合,深层语义特征可以减少复杂背景干扰并提高模糊裂缝区域特征响应,浅层特征可以提高裂缝细节表达能力,进而提高裂缝特征质量;最后,提出了混合空洞卷积边界细化模块,该模块利用残差网络和空洞卷积组细化裂缝边界,从而提高裂缝分割准确性。在数据集Bridge_Crack_Image_Data和Crack Forest Dataset上进行了测试,所提算法的准确率分别达到了92.1%和91.6%,F1分数分别达到了80.2%和91.1%。实验结果表明,所提算法在复杂自然环境下可获得稳定而准确的分割结果,具有较强的泛化性。
图像处理 裂缝检测 VGG16 整体嵌套网络 混合空洞卷积 语义分割 
激光与光电子学进展
2022, 59(10): 1010003
作者单位
摘要
西安建筑科技大学 信息与控制工程学院,陕西西安710055
高分辨率图像具有特征尺度差异较大的特点,针对其造成的细粒度特征难以捕获、多尺度特征融合不佳问题,提出一种共享核空洞卷积与注意力引导(Kernel-Sharing Dilated Convolutions and Attention-guided FPN,KDA-FPN)的复杂场景文本检测方法;提出最小交集(Intersection Over Minimum,IOM)后处理策略,改善因文本长宽比变化较大特性导致的掩膜重叠现象,提升检测效果。首先,模型以Resnet50为主干网络采用FPN结构捕获多尺度特征;然后,利用空洞卷积扩大特征感受野,提高特征信息的多尺度捕获能力,深层次挖掘文本细粒度特征,并通过共享核手段减少模型参数量,降低计算成本;同时,采用上下文注意模块(Context Attention Module,CxAM)捕捉多感受野间的语义信息关系,通过内容注意模块(Content Attention Module,CnAM)精确定位目标位置信息,增强多尺度融合能力,提升特征图质量;最后,将同一文本区域预测的候选框按大小排列,提出将面积最大的框与相邻文本框之间区域的交集面积占较小框面积的比值作为候选框筛选指标,抑制检测结果的掩模重叠现象,实现文本的精准检测。采用ICDAR2013、ICDAR2015、Total-Text数据集进行对比实验,实验结果表明,本文模型对于水平场景文本检测的精度和召回率分别为95.3和90.4;对于倾斜文本检测的精度和召回率分别为87.1和84.2;对于任意形状文本检测的精度和召回率分别为69.6和57.3。提出的算法有效克服了图像分辨率、文本形状与长度等因素的影响,提高了检测精度,得到了更为精准的文本边界。
文本检测 注意力结构 共享核空洞卷积 特征金字塔网络 text detection attention structure kernel-sharing dilated convolutions feature pyramid network 
光学 精密工程
2021, 29(8): 1955
作者单位
摘要
1 西京学院电子信息工程系,陕西 西安 710123
2 西安交通大学电信学院计算机科学与技术系,陕西 西安 710049
提出了一种基于多引导滤波器的单幅图像超分辨率方法。首先,该方法通过大量的自然图像建立高低分辨率图像块样本训练库,并通过聚类算法将具有相似性质的高低分辨率样本块进行聚类;其次,将输入低分辨率图像进行重叠分块,并在样本库中搜索最近邻的高低分辨率样本聚类;再次,将输入低分辨率图像块作为输入图像,与样本库中最近邻的低分辨率聚类样本作为引导图像,运用本文提出的多引导滤波器计算引导滤波器的参数;最后,利用样本库中最近邻的高分辨率聚类样本和引导滤波器的参数,通过多引导滤波器就可以重构高分辨率图像。实验结果表明,本文算法不仅能很好地重构图像的高频细节,还能很好地恢复图像的纹理特征。
超分辨率 引导滤波器 样本训练库 高频细节 super resolution guided filtering exemplar training database high frequency detail 
红外技术
2017, 39(10): 920
作者单位
摘要
1 西安交通大学智能网络与网络安全教育部重点实验室, 陕西 西安710049
2 防化研究院, 北京102205
3 北京康尔兴科技发展有限公司, 北京100088
针对非分散红外光谱传感器零点和温度漂移问题, 建立了一种基于零气光强、 参考光强、 标准温度、 环境温度、 温度漂移系数等多参数模型, 对红外传感器长期连续运行中存在的零点和温度漂移进行自动校正和补偿。 测试结果和长时间应用表明, 仪器在各种变换的环境条件下检测精度均小于5%F.S。 CO2的平均检测精度从未综合处理前的9.26%提高到了处理后的1.23%, CH4的平均检测精度从未综合处理前的10.61%提高到了处理后的0.70%, 克服了很多气体检测仪存在的稳定性差, 标定周期短等不足, 有效提高了仪器的检测精度、 稳定性, 降低了维护成本。
非分散红外光谱 参数模型 零点自校正 温度补偿 Non-dispersive infrared Multi-parameter model Baseline auto-correction Temperature compensation 
光谱学与光谱分析
2012, 32(11): 2976
李翠萍 1,2,*韩九强 1黄启斌 2穆宁 2[ ... ]张琳 2
作者单位
摘要
1 西安交通大学智能网络与网络安全教育部重点实验室, 陕西 西安710049
2 防化研究院, 北京102205
3 国家农业信息化工程技术研究中心, 北京100097
4 北京普析通用仪器有限责任公司, 北京100081
微小型移动式现场在线检测技术是分析仪器发展的新领域。 针对复杂工作环境中谱图存在强噪声干扰、 谱峰重叠、 不规则峰形等严重影响仪器的定性和定量准确度的瓶颈技术, 提出了一种基于小波变换和高斯拟合相结合的谱图在线综合处理方法, 用自研的仪器对甲苯和全氟三丁胺两种典型化合物的谱图进行了处理, 并与实验室分析仪器普遍应用的算法进行了对比分析。 结果表明, 综合方法能够有效解决强噪声干扰、 谱峰重叠、 不规则峰形问题, 提高仪器的定性和定量准确性, 同时能够实现数据压缩, 满足仪器的在线实时检测要求。 综合方法处理甲苯特征峰的平均信噪比(SNR)较移动平滑方法提高了1.3倍, 峰位误差ΔM降低了3.6倍, 处理全氟三丁胺谱图的数据压缩比为197∶1。
小波变换 高斯拟合 信号去噪 谱图处理 数据压缩 现场在线检测 Wavelet transform Gaussian fitting Signal de-noising spectrogram processing Data compression In situ analysis 
光谱学与光谱分析
2011, 31(11): 3050
作者单位
摘要
1 西安交通大学 电信学院,陕西 西安 710047
2 太原卫星发射中心,山西 太原 030027
研究了在雷达/红外复合制导中如何将雷达的距离信息应用于红外图像序列的目标跟踪。针对目标渐进的图像序列,通过分析图像放大对相关性的影响,制定了一种根据弹目距离确定模板更新周期的模板更新策略。将距离更新、定时更新和基于目标模板缓冲区的模板更新相结合,提出了一种融合距离信息的自适应模板更新算法。以一座大楼为目标,验证了该方法的有效性。结果表明,该方法对目标渐进的图像序列有较强的自适应性,比传统方法大大提高了跟踪精度和跟踪稳定性,对实验中各类图像的跟踪正确率达90%以上。
红外跟踪 相关跟踪 模板匹配 模板更新 信息融合 infrared tracking correlation tracking template matching template updating information fusion 
光学 精密工程
2010, 18(8): 1862
作者单位
摘要
1 海南大学 机电工程学院,海南 儋州 571737
2 西安交通大学 电子与信息工程学院,西安710049
针对虹膜识别中的睫毛干扰抑制问题,本文提出了一种基于形态学算子的睫毛干扰抑制算法。该算法将虹膜图像中的睫毛对象看作是背景图像中存在的随机的、不规则的细微裂缝,通过膨胀算子对这些裂缝进行像素填补,实现了对睫毛干扰的有效抑制。与常见的高斯滤波法相比,所提算法具有更强的睫毛干扰抑制能力。通过CASIA 虹膜库的仿真实验表明,所提算法比高斯滤波法消除的睫毛像素点要多40%,可以使Daugman 和Wildes定位算法的定位精度分别提高1.7%和2%,定位时间分别减少27.9%和24.2%。
虹膜识别 睫毛干扰 形态学算子 膨胀算子 iris recognition eyelash interference morphological operator dilation operator 
光电工程
2009, 36(12): 103

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!