作者单位
摘要
1 西京学院 材料与能源科学技术研究院,陕西 西安 710123
2 北京星航机电装备有限公司,北京 100074
3 西北工业大学 光电与智能研究院,陕西 西安 710072
在计算机视觉领域中,基于孪生网络的跟踪算法相比于传统算法提高了精度和速度,但是仍会受到目标遮挡、变形、环境变化等影响,导致孪生网络的跟踪算法的性能降低。为了深入了解基于孪生网络的单目标跟踪算法,本文对现有基于孪生网络目标跟踪算法进行了总结和分析,主要包括在孪生网络中引入注意力机制方法、超参数推理方法和模板更新方法,对这3种方法的目标跟踪算法进行了综述,详细介绍了国内外近几年基于孪生网络的算法研究和发展现状。对3个方面的代表算法采用VOT2016、VOT2017、VOT2018和OTB-2015数据集进行实验对比,获得了多种基于孪生网络的目标跟踪算法的性能。最后对基于孪生网络的目标跟踪算法进行了总结,并对未来的发展方向进行了展望。
计算机视觉 目标跟踪 孪生网络 深度学习 computer vision target tracking Siamese networks deep learning 
液晶与显示
2024, 39(2): 192
作者单位
摘要
1 辽宁工程技术大学 软件学院,辽宁 葫芦岛 125105
2 汕头职业技术学院 计算机系,广东 汕头 515071
现有的层级式文本生成图像的方法在初始图像生成阶段仅使用上采样进行特征提取,上采样过程本质是卷积运算,卷积运算的局限性会造成全局信息被忽略并且远程语义无法交互。虽然已经有方法在模型中加入自注意力机制,但依然存在图像细节缺失、图像结构性错误等问题。针对上述存在的问题,提出一种基于自监督注意和图像特征融合的生成对抗网络模型SAF-GAN。将基于ContNet的自监督模块加入到初始特征生成阶段,利用注意机制进行图像特征之间的自主映射学习,通过特征的上下文关系引导动态注意矩阵,实现上下文挖掘和自注意学习的高度结合,提高低分辨率图像特征的生成效果,后续通过不同阶段网络的交替训练实现高分辨率图像的细化生成。同时加入了特征融合增强模块,通过将模型上一阶段的低分辨率特征与当前阶段的特征进行融合,生成网络可以充分利用低层特征的高语义信息和高层特征的高分辨率信息,更加保证了不同分辨率特征图的语义一致性,从而实现高分辨率的逼真的图像生成。实验结果表明,相较于基准模型(AttnGAN),SAF-GAN模型在IS和FID指标上均有改善,在CUB数据集上的IS分数提升了0.31,FID指标降低了3.45;在COCO数据集上的IS分数提升了2.68,FID指标降低了5.18。SAF-GAN模型能够有效生成更加真实的图像,证明了该方法的有效性。
计算机视觉 生成对抗网络 文本生成图像 CotNet 图像特征融合 computer vision generative adversarial networks text-to-image cotnet image feature fusion 
液晶与显示
2024, 39(2): 180
陈建明 1,2李定鲣 1曾祥津 1,2任振波 3[ ... ]秦玉文 1,2,**
作者单位
摘要
1 通感融合光子技术教育部重点实验室,广东省信息光子技术重点实验室,广东工业大学信息工程学院,先进光子技术研究院,广东 广州 510006
2 南方海洋科学与工程广东省实验室(珠海),广东 珠海 519082
3 光场调控与信息感知工业和信息化部重点实验室,陕西省信息光子技术重点实验室,西北工业大学物理科学与技术学院,陕西 西安 710129
提出一种跨模态光学信息交互和模板动态更新的可见光和热红外(RGBT)跟踪方法,选取能够在跟踪速度和精度上取得平衡的Siamese跟踪器作为基本框架,并设计特征交互模块以重构不同模态的信息比例和增强模态间信息交流。在此基础上,基于无锚框的思想构建预测网络,以提升跟踪器的灵活性和通用性,同时提出一种模板动态更新的策略,通过动态更新跟踪模板增强模型对变化目标的适应能力。在GTOT等3个基准数据集上的对比实验表明,所提方法可显著提升跟踪器在复杂环境下的目标跟踪性能。
机器视觉 计算机视觉 目标跟踪 孪生网络 模板更新 
光学学报
2024, 44(7): 0715001
张晶晶 1,2,3,*杜兴卓 1,2,3支帅 4,5丁国鹏 4,5,*
作者单位
摘要
1 中国地质大学(武汉) 自动化学院,湖北武汉430074
2 复杂系统先进控制与智能自动化湖北省重点实验室,湖北武汉430074
3 地球探测智能化技术教育部工程研究中心,湖北武汉40074
4 中国科学院 微小卫星创新研究院,上海201203
5 上海微小卫星工程中心,上海201203
为解决基于深度学习的立体匹配方法面临着网络规模大、网络结构复杂等问题,提出了一个网络规模较小、精度较高的网络结构。该网络在特征提取模块删减修改了复杂冗余的残差层并引入了空洞卷积金字塔池化模块来扩大视野范围,提取更多有用的上下文信息;在代价计算模块中使用了三维卷积层以成本聚合提升立体匹配的精度;最后,在代价聚合模块引用了双边格网模块以较低分辨率的成本量来获取精度较高的视差图。将该网络在KITTI 2015数据集和Scene Flow数据集等主流数据集上进行实验,结果显示,相较于其他主流优秀网络类如金字塔立体匹配网络(Pyramid Stereo Matching Network ,PSM-Net),网络规模参数量减少了约38%,并取得了较高的实验精度,其中Scene Flow数据集的终点误差(End-point Error,EPE)为0.86,是一个同时兼顾速度与精度的立体匹配网络。
计算机视觉 立体匹配 人工神经网络 视差 computer vision stereo matching artificial neural network parallax 
光学 精密工程
2024, 32(3): 445
刘景赫 1,2林宝军 1,2,3,*
作者单位
摘要
1 中国科学院 微小卫星创新研究院,上海 201203
2 中国科学院大学,北京 100049
3 中国科学院 空天信息创新研究院,北京 100049
传统的单目姿态估计算法采用卷积网络在图像中定位若干关键点,再基于2D-3D匹配技术估计目标的姿态,但卫星上的关键点分布较分散,卷积网络由于其受限的感受野导致关键点的定位精度低,影响后续姿态估计的精度。此外传统流程需要人工标注关键点位置和目标的掩膜,标注成本高。为了解决传统方法感受野受限问题,在卷积网络中引入自注意力机制,赋予其全局建模能力,提高了关键点的定位精度。为了改善传统方法需要大量人工标注的问题,通过空间雕刻,重构了目标的点云,再将点云重投影回像素平面,自动化获取所需标签,省略了人工标注过程,提高了算法实用性。实验结果表明:所提算法在SPEED数据集上进行验证,关键点定位精度为92%,姿态平移误差为0.236%,姿态旋转误差为9.86×10-3弧度,在简化算法复杂度的同时提升了精度。可以有效应用于航天器之间的相对姿态估计。
计算机视觉 姿态估计 关键点检测 自注意力 空间雕刻 computer vision pose estimation landmark localization self-attention space carving 
液晶与显示
2023, 38(12): 1736
谢万鹏 1刘欢 1吴银花 1陈雷 2[ ... ]韩军 1,*
作者单位
摘要
1 西安工业大学 光电工程学院,陕西 西安 710021
2 西安工业大学 计算机科学与工程学院,陕西 西安 710021
为了解决单色视频和彩色视频的全自动高精度配准问题,设计了针对视频配准的首帧及后续帧配准方法,在保证配准速度的同时提高了配准精度。对于首帧,首先在尺度不变特征变换(SIFT)基础上,基于双摄像头的特点进行了改进,进而对单色视频和彩色视频进行了粗配准,增加了粗配准矩阵的获取稳定性和精确性;随后根据粗配准矩阵系数,使用尺度金字塔模式对单色视频和彩色视频的配准矩阵进行了配准修正。对于视频中的后续帧,采用具有步长金字塔的平移修正方法,对首帧中得到的修正配准矩阵进行再利用,并通过平移修正方法弥补了由不确定时差波动和相机摆动带来的平移误差,最终提高了单色视频和彩色视频的配准效率和配准精确度。实验结果表明,对于640×480大小的单色视频和彩色视频,本文算法相比传统SIFT算法将首帧配准均方根误差减少了0.79%,首帧标记点误差由约为1像素缩小到不可察,且连续视频帧的平均配准时间为0.357 s,同时仍然保持标记点误差不可察,较好地满足了单色视频和彩色视频配准的全自动、精度高、速度快、鲁棒性强等要求。
计算机视觉 视频配准 时空相似性 高精度修正 computer vision video alignment spatio-temporal similarity high-precision correction 
液晶与显示
2023, 38(12): 1689
作者单位
摘要
1 国防科技大学电子科学学院湖南长沙 410073
2 国防科技大学气象海洋学院湖南长沙 410073
迭代最近点法(ICP)及其变体是三维点云刚性配准的典型方法, 但此类通过迭代计算逐点距离矩阵实现点云配准的方式, 严重制约了点云的配准效率。本文提出一种快速 ICP算法, 利用 Frobenius范数表示待配准的两幅点云之间的误差函数, 获得误差值最小点位置, 并对此位置进行奇异值分解, 从而得到旋转矩阵和平移向量, 极大压缩了迭代次数和配准时间。在 Standford数据集和 3DMatch数据集上进行试验, 与传统 ICP算法及其变体、3种基于学习的点云配准算法进行对比, 本文方法配准效率最优; 在达到相近的配准精确度时, 提出的快速 ICP方法的迭代次数仅为传统 ICP算法的 0.2倍, 在 Standford数据集上配准所需时间为传统 ICP算法的 1/4, 在 3D Match数据集上配准所需时间为传统 ICP算法的 1/8倍。本文提出的快速 ICP算法在数据量大的点云场景下, 具有更高的效率。
三维计算机视觉 点云数据处理 点云配准 快速迭代最近点法 Frobenius范数 奇异值分解 3D computer vision point cloud data processing point cloud registration fast iterative closest point method Frobenius norm Singular Value Decomposition(SVD) 
太赫兹科学与电子信息学报
2023, 21(10): 1263
作者单位
摘要
1 东南大学 机械工程学院,江苏南京289
2 无锡尚实电子科技有限公司,江苏无锡14174
在TFT-LCD面板缺陷检测中,检测对象背景复杂、缺陷细微且种类繁多,而工业生产实时性要求高,传统的缺陷分类算法往往难以兼顾精度和速度要求,无法适用于实际生产应用。为均衡TFT-LCD面板缺陷分类的准确率和速率,提出一种基于Swin Transformer的轻量化深度学习图像分类模型。首先对模型每层输入的特征图进行Token融合以减少模型计算量,从而提高模型的轻量化水平。其次引入深度可分离卷积模块以帮助模型增加卷积归纳偏置,从而缓解模型对海量数据的依赖问题。最后使用知识蒸馏方法来克服模型轻量化导致的检测精度下降问题。在自制TFT-LCD面板缺陷分类数据集上的实验表明,本文提出的改进模型相比基线模型,FLOPs计算量降低了2.6 G,速度指标提升了17%,而Top-1 Acc精度仅损失1.3%,且与其他图像分类主流模型相比,在自制数据集和公开数据集上都具有更均衡的精度和速度。
TFT-LCD Transformer 图像分类 计算机视觉 Thin Film Transistor Liquid Crystal Display(TFT-LCD) transformer image classification computer vision 
光学 精密工程
2023, 31(22): 3357
作者单位
摘要
1 天津大学精密测试技术及仪器国家重点实验室,天津 300072
2 微纳制造实验室,天津 300072
工件的表面质量对零件可靠性、质量和使用寿命的影响至关重要。尽管各种基于计算机视觉的目标检测框架已经被广泛应用于工业表面缺陷检测场景,但由于面型的影响以及缺陷之间的混叠性,超精加工工件表面缺陷检测仍然具有挑战性。因此,提出了一种频率嵌入双分支参数预测网络来预测滤波参数,滤除掉型面信息从而使得缺陷特征更加显著。基于智能型面分析的预处理后,提出了一种基于级联区域神经网络感受野增强缺陷检测网络,将可变形卷积间隔地替换到高效网络的卷积模块中,有效地提高了主干网络特征提取的能力,然后重新选择特征图组成新的特征金字塔网络以提高效率,进一步提高网络性能。此外,还构建了具有滤波参数标注信息的滤波参数数据集UPP-CLS和具有缺陷类别及位置的缺陷检测数据集UPP-DET。模型在UPP-CLS上达到了85.36%的准确性,相较于现有网络提升3~5个百分点;在UPP-DET上达到了0.862的平均精度,相较于现有网络提升5.3%~7.8%。模型整体性能优于主流网络结构。源代码将在https://gitee.com/zihaodl/detect_app上开源。
超精密加工 计算机视觉 缺陷检测 型面分析 
激光与光电子学进展
2023, 60(24): 2412006
作者单位
摘要
1 国网辽宁省电力有限公司电力科学研究院,沈阳 110006
2 国网辽宁省电力有限公司,沈阳 110006
3 沈阳农业大学 信息与电气工程学院,沈阳 110161
4 国网辽宁营销服务中心,沈阳 110168
电力电缆敷设不规范是导致绝缘故障的主要原因,影响电缆的安全运行。当前电缆敷设质量检测多采用人工接触式测量,主观性强、精度低,容易对敷设区域造成二次损伤。文章提出一种基于点云的隧道电缆敷设质量参数自动检测方法。首先在电缆敷设施工位置获取隧道电缆点云数据;之后基于隧道的结构特征分割出电缆点云;最后,基于颜色和形态特征从电缆点云中分割出敷设区域并自动测量敷设质量参数。所提出的电缆和敷设区域点云分割算法的平均精确度、召回率、F1分数均大于0.92,自动测量的4个敷设质量参数平均绝对误差均小于0.35 mm。试验表明,该方法可以准确定位电缆敷设区域,并对敷设质量参数进行自动精准测量。
三维激光点云 电缆敷设 点云分割 计算机视觉 3D laser point cloud cable laying point cloud segmentation computer vision 
半导体光电
2023, 44(3): 460

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!