付星 1,2,*†石子健 1,2†常河彬 3柳强 1,2闫兴鹏 3,**
作者单位
摘要
1 清华大学精密仪器系,激光与光子技术研究所,北京 100084
2 时空信息精密感知技术全国重点实验室,北京 100084
3 陆军装甲兵学院信息通信系,北京 100072
全息体视图可利用光学打印、计算机生成方法获得,具有制作简单、视觉效果真实等特点,有望应用在大幅面全息显示、增强现实(AR)和虚拟现实(VR)等领域中。介绍全息体视图光学打印技术的写入方法的发展和打印装置的更新,以及计算全息体视图中计算方法的迭代和计算速度的提升,讨论了当前面临的挑战,并对全息体视图的未来发展进行了展望。
三维显示 全息体视图 打印技术 计算方法 
激光与光电子学进展
2024, 61(2): 0211006
作者单位
摘要
1 浙江大学信息与电子工程学院,浙江 杭州 310027
2 北京航天飞行控制中心,北京 100190
3 航天飞行动力学技术重点实验室,北京 100190
4 浙江省信息处理与通信网络重点实验室,浙江 杭州 310027
针对目前图像匹配算法在月面宽基线、弱纹理和光照变化等条件下匹配成功率低的问题,提出基于视图合成与全局注意力的月面图像匹配方法。首先对同站点月面双目图像使用稀疏视差虚真值训练立体匹配网络,完成同站点图像的三维重建。基于场景深度,结合站点之间惯导先验位姿将待匹配图像转为新的合成视图用于匹配,解决不同站点宽基线图像对之间图像重叠度低、视角变化大等问题。进一步使用基于Transformer的图像匹配网络,提高弱纹理场景下的图像匹配性能,并在后处理阶段引入考虑平面退化的外点滤除方法。在真实月面宽基线图像数据集的结果表明,相比现有算法,提出的匹配算法大幅度提高了宽基线场景下的月面图像匹配精度与成功率,为月球车大跨度行驶中的自主视觉定位提供了重要基础。
图像处理 月面图像匹配 特征提取 视图合成 三维重建 
光学学报
2023, 43(24): 2410001
作者单位
摘要
1 江西理工大学 理学院,江西赣州34000
2 江西理工大学 电气工程与自动化学院,江西赣州341000
多视图立体重建(Multi-view stereo Reconstruction,MVS Reconstruction)的目标是根据一组已知摄像机参数的多视角图像来重建场景的三维模型,是近年来三维重建的一类主流方法。本文针对最新的近百个基于深度学习的MVS方法做了较为系统的算法评估对比。首先,对现有的基于监督学习的MVS方法,按照特征提取、代价体构建、代价体正则化和深度回归的重建流程对各算法进行梳理,重点对代价体构建和正则化这两阶段的改进策略进行归纳总结,对于无监督的MVS方法,主要分析各算法损失项的设计,并按照其训练方式进行分类;其次,总结了MVS方法常用的实验数据集及其对应的性能评价指标,进一步研究特征金字塔结构、注意力机制、由粗到精等策略的引入对MVS网络性能的影响;此外,介绍了MVS方法的具体应用场景,包括数字孪生、自动驾驶、机器人技术、遗产保护、生物科学等领域;最后,提出关于MVS改进方向的建议,并对多视图三维重建未来的技术难点与研究方向进行探讨。
视图立体 三维重建 深度学习 深度估计 单应性变换 multi-view stereo 3D reconstruction deep learning depth estimation homography transformation 
光学 精密工程
2023, 31(16): 2444
作者单位
摘要
杭州电子科技大学通信工程学院,浙江 杭州 310037
多视图立体匹配是计算机视觉领域的一大研究热点,针对目前多视图立体重建完整性差、无法处理高分辨率图像和GPU内存消耗巨大、运行时间长等问题,提出一种基于自注意力机制的深度学习网络(SA-PatchmatchNet)。首先通过特征提取模块提取图像特征,再将其送入可学习的Patchmatch模块中,得到深度图,并对深度图进行优化,生成最终的深度图。为了捕捉深度推理任务中的重要信息,将自注意力机制融入到特征提取模块,提高了网络的特征提取能力。实验结果表明,SA-PatchmatchNet在Technical University of Denmark(DTU)数据集上进行测试,与PatchmatchNet相比,重建的完整性提升5.8%,整体性提升2.3%,与其他的state-of-the-art(SOTA)方法相比,完整性和整体性都得到了较大的提升。
深度学习 三维重建 视图立体 自注意力机制 
激光与光电子学进展
2023, 60(16): 1615009
衡玮 1,2俞健 1,2,*达飞鹏 1,2,3,**
作者单位
摘要
1 东南大学自动化学院,江苏 南京 210096
2 东南大学复杂工程系统测量与控制教育部重点实验室,江苏 南京 210096
3 东南大学深圳研究院,广东 深圳 518063
针对宽基线场景下的拼接因视差导致伪影和瑕疵的问题,提出了一种基于密集视点插值的实时视频拼接方法。该方法采用在左右相机的基线上补充密集中间视点的方式,为拼接的重叠区域合成平滑过渡的插值视图,以更好地对齐多个输入。为生成该插值视图,利用立体匹配中的匹配代价,设计了网络用来预测在原视图中采样的像素位移场。所提方法在没有插值视图真值的情形下,利用视点间的空间变换关系,指引网络学习视图生成规则。实验结果表明,所提方法能提升视频图像拼接后的视觉观感,并可以达到实时性能,满足实际场景中的应用需求。
机器视觉 视频拼接 宽基线 深度学习 视图插值 
光学学报
2023, 43(14): 1415003
作者单位
摘要
西北大学信息科学与技术学院,陕西 西安 710127
颅骨身份识别是法医学研究的重要课题。针对以往颅骨身份识别研究中颅骨和面貌内在特征表示能力不足的问题,为了充分利用颅骨和面皮模型的有效识别信息、提高颅骨识别能力,提出一种基于视图特征和形状特征融合的颅骨身份识别方法。首先,采用多视图神经网络学习颅骨和面皮的多视图特征,采用基于双谐波距离的LS-MDS算法计算颅骨和面皮的标准形,采用池化融合方法聚合多个特征来减少视图池化阶段的信息丢失;然后,为了解决波核特征对尺度变换敏感的问题,根据特征值归一化思想提取颅骨和面皮的尺度不变波核特征;最后,采用核典型相关分析将视图特征和波核特征进行融合,得到颅骨和面皮的最终特征向量,通过计算颅骨特征向量和面皮特征向量的相关系数实现颅骨的身份识别。实验结果表明,所提方法的识别正确率为95.4%,优于其他对比方法,是一种有效的颅骨身份识别方法。
图像处理 颅骨身份识别 视图特征 波核特征 核典型相关分析 相关系数 
激光与光电子学进展
2023, 60(10): 1010011
作者单位
摘要
天津大学微电子学院,天津 300072
脑肿瘤分割对医学图像处理领域发展与人类健康都具有积极意义。针对三维卷积神经网络存在复杂度大且对硬件设备要求高等问题,提出一种多视图卷积轻量级脑肿瘤分割算法。首先使用复用器模块有效融合各通道间的信息,并为模型增加提取非线性特征的能力。其次使用伪三维卷积分别从轴向位、矢状位和冠状位进行卷积,并加入组卷积以节约计算资源和降低设备显存使用。最后使用可训练参数权衡不同视图下提取的特征的重要性,提高模型分割精度。此外,实验使用分布式数据并行方法训练模型,以提升图形处理器的利用率。在2019年脑肿瘤分割大赛公开数据集上的实验结果表明,所提算法的平均Dice相似度系数仅低于第一名算法2.52个百分点,然而参数量与浮点运算次数分别降低了84.83%和96.67%,且平均Dice相似度系数高于第二名算法0.05%。通过对比实验分析,验证了所提算法的精确与轻量,为脑肿瘤分割模型的广泛应用提供了可能性。
视图 卷积神经网络 脑肿瘤分割 深度学习 轻量级 
激光与光电子学进展
2023, 60(10): 1010018
作者单位
摘要
1 中国科学院上海技术物理研究所中国科学院智能红外感知重点实验室,上海 200083
2 国科大杭州高等研究院,浙江 杭州 310024
3 中国科学院大学,北京 100049
对空间目标进行三维重建能够为在轨服务卫星提供服务对象的结构信息,是提高系统自主性的关键技术。受空间目标的结构对称性以及成像非朗伯特性的影响,传统的重建方法存在特征点匹配错误或特征点匹配不足的问题,重建精度低。针对该问题,提出了一种基于MVSNet深度学习网络实现空间目标三维重建的方法,利用深度学习提取图像高层语义,提高了立体匹配的鲁棒性。首先,基于空间目标的成像特点,分析了模型的几何结构和材质对重建结果的影响,设计了搭建在Blender平台上的空间目标多视图采集系统。然后,基于MVSNet深度学习网络,采用多尺度卷积充分提取了图像的深度特征,并通过编码解码结构融合和规整上下文信息进行了立体匹配,有效解决了传统方法重建卫星的弱纹理、反射、重复纹理等区域时对特征点的高度依赖问题。最后通过残差网络解决了多次卷积造成的边界过平滑问题,进一步提升了重建效果。实验结果表明,所设计的重建模型的平均准确度误差为0.449 mm,平均完整度误差为0.379 mm,误差综合评价为0.414 mm,精度较经典开源软件COLMAP提升了20%。该方法为空间操作自动化提供了技术参考,进一步推动了三维重建在相关领域中的应用。
遥感 深度学习 视图 空间目标三维重建 卷积神经网络 编码解码结构 
中国激光
2022, 49(23): 2310003
作者单位
摘要
1 中山大学电子与信息工程学院光电材料与技术国家重点实验室,广东 广州 510275
2 中山大学物理学院,广东 广州 510275
近眼小孔因对入射瞳孔光束光斑尺寸的有效约束而被用于基于时序复用的超多视图显示,可以实现较大的景深,但小的尺寸也导致一个近眼小孔所能实现视角的严重受限。设计多组近眼小孔时序选通,通过同组不同近眼小孔各自对应显示区域的拼连,可以有效解决各时间点仅通过一个近眼小孔观察时所面临的视角受限问题;但各近眼小孔对应显示区域出射光通过非对应小孔出射,又引入串扰噪声这一新问题。针对头戴式显示,设计同组相邻近眼小孔具有相异正交特性的多组近眼小孔,利用各显示区域所出射正交特性光被其对应小孔的相邻小孔屏蔽的特性,解决同组相邻小孔间的串扰问题。搭建验证性头戴式超多视图显示系统,在由M个一维条状小孔构建的一个近眼小孔组中,设计相邻2个近眼小孔,分别仅允许偏振方向相互垂直的光通过;基于视觉滞留效应,利用T个近眼小孔组的时序选通,实现单眼T个视点的超多视图显示。相对于一个时间点仅一个近眼小孔选通的情况,近眼小孔组使视角得到M倍的扩展。受制于所使用的常规投影透镜,仅取M=3进行验证时,视角扩展为19.7°。
三维显示 超多视图 视角扩展 条状小孔 
激光与光电子学进展
2022, 59(20): 2011015
作者单位
摘要
1 昆明理工大学信息工程与自动化学院,云南 昆明 650500
2 云南大学信息学院,云南 昆明 650091
利用X射线影像进行胸部疾病诊断是一种常用的诊断方法,具有重要的临床诊断价值。随着大规模可用数据集的发布,已经提出了几种利用胸部X射线图像预测常见疾病的方法。然而大多数现有的预测模型大都仅考虑单个视图,忽略了多视图影像对于临床医生诊断的支持作用。此外使用单个模型进行影像特征抽取时,存在有效特征提取不全的问题,进而导致疾病预测准确率较低。为此,提出了一种新的深度相关多级特征融合方法(DFFM),该方法融合不同模型提取的不同视图的视觉特征,以提高疾病预测的准确性。并在目前最大的胸部X射线数据集MIMIC-CXR上进行了验证,实验结果表明,所提方法的area under the receiver operating characteristic curve (AUC)值达0.847,与现有的单视图及简单进行特征拼接的多视图模型相比,AUC值分别提升了12.6个百分点和5.3个百分点,验证了所提多级融合方法的有效性。
医用光学 疾病预测 模型融合 深度相关 视图 特征抽取 
激光与光电子学进展
2022, 59(18): 1817001

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!