相同关键词【计算机视觉】论文列表 -- 中国光学期刊网

研究论文

视觉跟踪技术中孪生网络的研究进展

贺泽民 ¹曾俊涛 ¹袁宝玺 ¹梁德建 ²苗宗成 ^3,*

作者单位

摘要

¹ 西京学院材料与能源科学技术研究院，陕西西安 710123

² 北京星航机电装备有限公司，北京 100074

³ 西北工业大学光电与智能研究院，陕西西安 710072

在计算机视觉领域中，基于孪生网络的跟踪算法相比于传统算法提高了精度和速度，但是仍会受到目标遮挡、变形、环境变化等影响，导致孪生网络的跟踪算法的性能降低。为了深入了解基于孪生网络的单目标跟踪算法，本文对现有基于孪生网络目标跟踪算法进行了总结和分析，主要包括在孪生网络中引入注意力机制方法、超参数推理方法和模板更新方法，对这3种方法的目标跟踪算法进行了综述，详细介绍了国内外近几年基于孪生网络的算法研究和发展现状。对3个方面的代表算法采用VOT2016、VOT2017、VOT2018和OTB-2015数据集进行实验对比，获得了多种基于孪生网络的目标跟踪算法的性能。最后对基于孪生网络的目标跟踪算法进行了总结，并对未来的发展方向进行了展望。

计算机视觉目标跟踪孪生网络深度学习 computer vision target tracking Siamese networks deep learning

PDF全文 Full Text

液晶与显示

2024, 39(2): 192

研究论文

基于自监督注意和图像特征融合的文本生成图像方法

廖涌卉 ¹张海涛 ^2,*金海波 ¹

作者单位

摘要

¹ 辽宁工程技术大学软件学院，辽宁葫芦岛 125105

² 汕头职业技术学院计算机系，广东汕头 515071

现有的层级式文本生成图像的方法在初始图像生成阶段仅使用上采样进行特征提取，上采样过程本质是卷积运算，卷积运算的局限性会造成全局信息被忽略并且远程语义无法交互。虽然已经有方法在模型中加入自注意力机制，但依然存在图像细节缺失、图像结构性错误等问题。针对上述存在的问题，提出一种基于自监督注意和图像特征融合的生成对抗网络模型SAF-GAN。将基于ContNet的自监督模块加入到初始特征生成阶段，利用注意机制进行图像特征之间的自主映射学习，通过特征的上下文关系引导动态注意矩阵，实现上下文挖掘和自注意学习的高度结合，提高低分辨率图像特征的生成效果，后续通过不同阶段网络的交替训练实现高分辨率图像的细化生成。同时加入了特征融合增强模块，通过将模型上一阶段的低分辨率特征与当前阶段的特征进行融合，生成网络可以充分利用低层特征的高语义信息和高层特征的高分辨率信息，更加保证了不同分辨率特征图的语义一致性，从而实现高分辨率的逼真的图像生成。实验结果表明，相较于基准模型（AttnGAN），SAF-GAN模型在IS和FID指标上均有改善，在CUB数据集上的IS分数提升了0.31，FID指标降低了3.45；在COCO数据集上的IS分数提升了2.68，FID指标降低了5.18。SAF-GAN模型能够有效生成更加真实的图像，证明了该方法的有效性。

计算机视觉生成对抗网络文本生成图像 CotNet 图像特征融合 computer vision generative adversarial networks text-to-image cotnet image feature fusion

PDF全文 Full Text

液晶与显示

2024, 39(2): 180

机器视觉

一种跨模态光学信息交互和模板动态更新的RGBT目标跟踪方法

陈建明 ^1,2李定鲣 ¹曾祥津 ^1,2任振波 ³[ ... ]秦玉文 ^1,2,**

作者单位

摘要

¹ 通感融合光子技术教育部重点实验室，广东省信息光子技术重点实验室，广东工业大学信息工程学院，先进光子技术研究院，广东广州 510006

² 南方海洋科学与工程广东省实验室（珠海），广东珠海 519082

³ 光场调控与信息感知工业和信息化部重点实验室，陕西省信息光子技术重点实验室，西北工业大学物理科学与技术学院，陕西西安 710129

提出一种跨模态光学信息交互和模板动态更新的可见光和热红外（RGBT）跟踪方法，选取能够在跟踪速度和精度上取得平衡的Siamese跟踪器作为基本框架，并设计特征交互模块以重构不同模态的信息比例和增强模态间信息交流。在此基础上，基于无锚框的思想构建预测网络，以提升跟踪器的灵活性和通用性，同时提出一种模板动态更新的策略，通过动态更新跟踪模板增强模型对变化目标的适应能力。在GTOT等3个基准数据集上的对比实验表明，所提方法可显著提升跟踪器在复杂环境下的目标跟踪性能。

机器视觉计算机视觉目标跟踪孪生网络模板更新

PDF全文 Full Text

光学学报

2024, 44(7): 0715001

信息科学

空洞卷积和双边格网的立体匹配网络

张晶晶 ^1,2,3,*杜兴卓 ^1,2,3支帅 ^4,5丁国鹏 ^4,5,*

作者单位

摘要

¹ 中国地质大学（武汉）自动化学院，湖北武汉430074

² 复杂系统先进控制与智能自动化湖北省重点实验室，湖北武汉430074

³ 地球探测智能化技术教育部工程研究中心，湖北武汉40074

⁴ 中国科学院微小卫星创新研究院，上海201203

⁵ 上海微小卫星工程中心，上海201203

为解决基于深度学习的立体匹配方法面临着网络规模大、网络结构复杂等问题，提出了一个网络规模较小、精度较高的网络结构。该网络在特征提取模块删减修改了复杂冗余的残差层并引入了空洞卷积金字塔池化模块来扩大视野范围，提取更多有用的上下文信息；在代价计算模块中使用了三维卷积层以成本聚合提升立体匹配的精度；最后，在代价聚合模块引用了双边格网模块以较低分辨率的成本量来获取精度较高的视差图。将该网络在KITTI 2015数据集和Scene Flow数据集等主流数据集上进行实验，结果显示，相较于其他主流优秀网络类如金字塔立体匹配网络（Pyramid Stereo Matching Network ，PSM-Net），网络规模参数量减少了约38%，并取得了较高的实验精度，其中Scene Flow数据集的终点误差（End-point Error，EPE）为0.86，是一个同时兼顾速度与精度的立体匹配网络。

计算机视觉立体匹配人工神经网络视差 computer vision stereo matching artificial neural network parallax

PDF全文 Full Text

光学精密工程

2024, 32(3): 445

研究论文

基于空间雕刻和自注意力机制的卫星姿态估计算法

刘景赫 ^1,2林宝军 ^1,2,3,*

作者单位

摘要

¹ 中国科学院微小卫星创新研究院，上海 201203

² 中国科学院大学，北京 100049

³ 中国科学院空天信息创新研究院，北京 100049

传统的单目姿态估计算法采用卷积网络在图像中定位若干关键点，再基于2D-3D匹配技术估计目标的姿态，但卫星上的关键点分布较分散，卷积网络由于其受限的感受野导致关键点的定位精度低，影响后续姿态估计的精度。此外传统流程需要人工标注关键点位置和目标的掩膜，标注成本高。为了解决传统方法感受野受限问题，在卷积网络中引入自注意力机制，赋予其全局建模能力，提高了关键点的定位精度。为了改善传统方法需要大量人工标注的问题，通过空间雕刻，重构了目标的点云，再将点云重投影回像素平面，自动化获取所需标签，省略了人工标注过程，提高了算法实用性。实验结果表明：所提算法在SPEED数据集上进行验证，关键点定位精度为92%，姿态平移误差为0.236%，姿态旋转误差为9.86

\times

10^-3弧度，在简化算法复杂度的同时提升了精度。可以有效应用于航天器之间的相对姿态估计。

计算机视觉姿态估计关键点检测自注意力空间雕刻 computer vision pose estimation landmark localization self-attention space carving

PDF全文 Full Text

液晶与显示

2023, 38(12): 1736

研究论文

基于改进SIFT和互信息法的单色和彩色视频高精度配准

谢万鹏 ¹刘欢 ¹吴银花 ¹陈雷 ²[ ... ]韩军 ^1,*

作者单位

摘要

¹ 西安工业大学光电工程学院，陕西西安 710021

² 西安工业大学计算机科学与工程学院，陕西西安 710021

为了解决单色视频和彩色视频的全自动高精度配准问题，设计了针对视频配准的首帧及后续帧配准方法，在保证配准速度的同时提高了配准精度。对于首帧，首先在尺度不变特征变换（SIFT）基础上，基于双摄像头的特点进行了改进，进而对单色视频和彩色视频进行了粗配准，增加了粗配准矩阵的获取稳定性和精确性；随后根据粗配准矩阵系数，使用尺度金字塔模式对单色视频和彩色视频的配准矩阵进行了配准修正。对于视频中的后续帧，采用具有步长金字塔的平移修正方法，对首帧中得到的修正配准矩阵进行再利用，并通过平移修正方法弥补了由不确定时差波动和相机摆动带来的平移误差，最终提高了单色视频和彩色视频的配准效率和配准精确度。实验结果表明，对于640×480大小的单色视频和彩色视频，本文算法相比传统SIFT算法将首帧配准均方根误差减少了0.79%，首帧标记点误差由约为1像素缩小到不可察，且连续视频帧的平均配准时间为0.357 s，同时仍然保持标记点误差不可察，较好地满足了单色视频和彩色视频配准的全自动、精度高、速度快、鲁棒性强等要求。

计算机视觉视频配准时空相似性高精度修正 computer vision video alignment spatio-temporal similarity high-precision correction

PDF全文 Full Text

液晶与显示

2023, 38(12): 1689

信号与信息处理、计算机与控制

基于 Frobenius范数奇异值分解的快速 ICP算法

许可 ¹顾尚泰 ¹元志安 ¹万建伟 ¹[ ... ]王玲 ¹

作者单位

摘要

¹ 国防科技大学电子科学学院湖南长沙 410073

² 国防科技大学气象海洋学院湖南长沙 410073

迭代最近点法(ICP)及其变体是三维点云刚性配准的典型方法, 但此类通过迭代计算逐点距离矩阵实现点云配准的方式, 严重制约了点云的配准效率。本文提出一种快速 ICP算法, 利用 Frobenius范数表示待配准的两幅点云之间的误差函数, 获得误差值最小点位置, 并对此位置进行奇异值分解, 从而得到旋转矩阵和平移向量, 极大压缩了迭代次数和配准时间。在 Standford数据集和 3DMatch数据集上进行试验, 与传统 ICP算法及其变体、3种基于学习的点云配准算法进行对比, 本文方法配准效率最优; 在达到相近的配准精确度时, 提出的快速 ICP方法的迭代次数仅为传统 ICP算法的 0.2倍, 在 Standford数据集上配准所需时间为传统 ICP算法的 1/4, 在 3D Match数据集上配准所需时间为传统 ICP算法的 1/8倍。本文提出的快速 ICP算法在数据量大的点云场景下, 具有更高的效率。

三维计算机视觉点云数据处理点云配准快速迭代最近点法 Frobenius范数奇异值分解 3D computer vision point cloud data processing point cloud registration fast iterative closest point method Frobenius norm Singular Value Decomposition(SVD)

PDF全文 Full Text

太赫兹科学与电子信息学报

2023, 21(10): 1263

信息科学

基于Swin Transformer轻量化的TFT-LCD面板缺陷分类算法

夏衍 ¹罗晨 ^1,*周怡君 ¹贾磊 ²

作者单位

摘要

¹ 东南大学机械工程学院，江苏南京289

² 无锡尚实电子科技有限公司，江苏无锡14174

在TFT-LCD面板缺陷检测中，检测对象背景复杂、缺陷细微且种类繁多，而工业生产实时性要求高，传统的缺陷分类算法往往难以兼顾精度和速度要求，无法适用于实际生产应用。为均衡TFT-LCD面板缺陷分类的准确率和速率，提出一种基于Swin Transformer的轻量化深度学习图像分类模型。首先对模型每层输入的特征图进行Token融合以减少模型计算量，从而提高模型的轻量化水平。其次引入深度可分离卷积模块以帮助模型增加卷积归纳偏置，从而缓解模型对海量数据的依赖问题。最后使用知识蒸馏方法来克服模型轻量化导致的检测精度下降问题。在自制TFT-LCD面板缺陷分类数据集上的实验表明，本文提出的改进模型相比基线模型，FLOPs计算量降低了2.6 G，速度指标提升了17%，而Top-1 Acc精度仅损失1.3%，且与其他图像分类主流模型相比，在自制数据集和公开数据集上都具有更均衡的精度和速度。

TFT-LCD Transformer 图像分类计算机视觉 Thin Film Transistor Liquid Crystal Display（TFT-LCD） transformer image classification computer vision

PDF全文 Full Text

光学精密工程

2023, 31(22): 3357

仪器，测量与计量

基于智能型面分析的抛光表面缺陷检测研究

李子豪 ^1,2房丰洲 ^1,2,*任仲贺 ^1,2侯高峰 ^1,2

作者单位

摘要

¹ 天津大学精密测试技术及仪器国家重点实验室，天津 300072

² 微纳制造实验室，天津 300072

工件的表面质量对零件可靠性、质量和使用寿命的影响至关重要。尽管各种基于计算机视觉的目标检测框架已经被广泛应用于工业表面缺陷检测场景，但由于面型的影响以及缺陷之间的混叠性，超精加工工件表面缺陷检测仍然具有挑战性。因此，提出了一种频率嵌入双分支参数预测网络来预测滤波参数，滤除掉型面信息从而使得缺陷特征更加显著。基于智能型面分析的预处理后，提出了一种基于级联区域神经网络感受野增强缺陷检测网络，将可变形卷积间隔地替换到高效网络的卷积模块中，有效地提高了主干网络特征提取的能力，然后重新选择特征图组成新的特征金字塔网络以提高效率，进一步提高网络性能。此外，还构建了具有滤波参数标注信息的滤波参数数据集UPP-CLS和具有缺陷类别及位置的缺陷检测数据集UPP-DET。模型在UPP-CLS上达到了85.36%的准确性，相较于现有网络提升3~5个百分点；在UPP-DET上达到了0.862的平均精度，相较于现有网络提升5.3%~7.8%。模型整体性能优于主流网络结构。源代码将在https：//gitee.com/zihaodl/detect_app上开源。

超精密加工计算机视觉缺陷检测型面分析

PDF全文 Full Text

激光与光电子学进展

2023, 60(24): 2412006

光电技术及应用

基于三维激光点云的隧道电缆敷设质量参数自动检测方法

郑维刚 ^1,*赵振威 ¹唐红 ¹张忠瑞 ²[ ... ]苗腾 ³

作者单位

摘要

¹ 国网辽宁省电力有限公司电力科学研究院,沈阳 110006

² 国网辽宁省电力有限公司,沈阳 110006

³ 沈阳农业大学信息与电气工程学院,沈阳 110161

⁴ 国网辽宁营销服务中心,沈阳 110168

电力电缆敷设不规范是导致绝缘故障的主要原因,影响电缆的安全运行。当前电缆敷设质量检测多采用人工接触式测量,主观性强、精度低,容易对敷设区域造成二次损伤。文章提出一种基于点云的隧道电缆敷设质量参数自动检测方法。首先在电缆敷设施工位置获取隧道电缆点云数据;之后基于隧道的结构特征分割出电缆点云;最后,基于颜色和形态特征从电缆点云中分割出敷设区域并自动测量敷设质量参数。所提出的电缆和敷设区域点云分割算法的平均精确度、召回率、F1分数均大于0.92,自动测量的4个敷设质量参数平均绝对误差均小于0.35 mm。试验表明,该方法可以准确定位电缆敷设区域,并对敷设质量参数进行自动精准测量。

三维激光点云电缆敷设点云分割计算机视觉 3D laser point cloud cable laying point cloud segmentation computer vision

PDF全文 Full Text

半导体光电

2023, 44(3): 460

关于本站 Cookie 的使用提示

全站搜索

热点聚焦

学术活动

关于本站 Cookie 的使用提示

全站搜索