相同关键词【visual perception】论文列表 -- 中国光学期刊网

作者单位

摘要

苏州科技大学电子与信息工程学院，江苏苏州 215009

视觉诱导晕动症是虚拟现实技术应用中较为严重的问题，沉浸在虚拟现实环境中的使用者普遍会存在头晕、恶心等症状。立体影像采集失真导致人眼感知的虚拟空间畸变，可能是诱发和增强视觉诱导晕动症的重要因素之一。为了研究立体影像采集失真对视觉诱导晕动症的影响，基于立体影像采集理论构建了虚拟空间畸变模型，针对具有三种焦距参数的镜头获取不同等级的立体空间畸变影像。通过视觉感知实验，对不同空间畸变下的视觉诱导晕动症进行主观和客观的评价。结果表明，当立体影像采集的相机视场角与人眼视场角不匹配时，立体影像失真对视觉诱导晕动症有显著性影响，立体影像采集失真会导致更为强烈的视觉诱导晕动症状。首次用系统性实验的方法验证采集参数与感知参数不匹配导致的虚拟空间畸变增强了视觉诱导晕动症的结论，研究结果对提出切实可行的缓解方法有重要意义。

视觉感知虚拟现实视觉诱导晕动症立体影像采集立体影像失真

PDF全文 Full Text

激光与光电子学进展

2024, 61(4): 0409001

大气光学与海洋光学

水下结构状态观测中的悬浮杂质遮挡消除方法

徐永兵 ^1,3周亚琴 ^2,*叶倩 ²贾江灿 ²王菂 ^1,3

作者单位

摘要

¹ 山东省水利勘测设计院有限公司，山东济南 250013

² 河海大学信息科学与工程学院，江苏常州 213022

³ 山东省水利勘测设计院有限公司济南市数字孪生与智慧水利重点实验室，山东济南 250013

水下结构状态视觉检测过程中，观测相机镜头易受到水体中枯叶、藻类等悬浮杂质遮挡，导致水下结构表观影像信息丢失，影响检测效果。针对该问题，利用水下视频序列中的帧内空间信息与帧间运动信息，提出一种悬浮杂质遮挡消除方法。根据相邻帧间的光流场分布信息，提出位移补偿策略，消除相机移动导致的帧间背景偏移；结合悬浮杂质成像特性，建立动态视觉感知模型，在对齐后的相邻帧基础上，实现不同形态悬浮杂质的准确检测；构建一种混合引导修复模型，确立帧间最优互补信息，还原悬浮杂质遮挡区域。在构建的真实与合成数据集上的测试结果表明，本文方法能够准确检测并消除悬浮杂质的遮挡，处理后的图像质量在多项指标上均得到明显提升。

水下图像复原悬浮杂质遮挡消除位移补偿动态视觉感知混合引导模型

PDF全文 Full Text

光学学报

2023, 43(24): 2401012

研究论文

近眼显示中光学畸变对视觉诱导晕动症的影响

马凤云夏振平 ^*程成彭子雄张元申

作者单位

摘要

苏州科技大学电子与信息工程学院，江苏苏州 215009

视觉诱导晕动症（VIMS）是虚拟现实（VR）体验过程中可能产生的一种常见症状，该症状严重降低了用户的体验的舒适度，阻碍了VR技术的推广和发展。虚拟空间畸变是影响VR体验舒适度的潜在因素之一，近眼显示设备不完全的畸变校正会产生虚拟空间畸变，进而可能引发VIMS。针对虚拟空间畸变对VIMS的影响程度，本文模拟VR技术的体验过程，对以VR技术为代表的近眼显示技术畸变机理进行分析，设计了3个不同畸变参数下VIMS等级评价的视觉感知实验，并对实验的主客观数据进行统计分析。结果表明，虚拟空间畸变对VIMS症状具有显著性影响，受测者观看立体影像的畸变程度越大，所引起的VIMS症状越明显。该研究可为VR技术体验的舒适度提升方向提供理论依据。

虚拟现实视觉感知畸变校正视觉诱导晕动症 virtual reality visual perception distortion correction visually induced motion sickness

PDF全文 Full Text

液晶与显示

2023, 38(9): 1215

成像系统

基于视觉感知的Mini-LED背光LCD中的光晕效应

张跃渊夏振平 ^*宋玉张博文胡伏原

作者单位

摘要

苏州科技大学电子与信息工程学院，江苏苏州 215009

作为前景广阔的高动态对比度显示系统，基于Mini-LED背光的液晶显示受到越来越多的关注。由于背光分区和液晶漏光问题，Mini-LED背光LCD中出现光晕效应，降低了图像质量。为了准确再现不同参数下的光晕效应，建立了精确的Mini-LED背光LCD显示系统光学模型。基于该模型设计了系统的视觉感知实验，研究不同Mini-LED背光分块大小、不同LCD对比度以及不同背光调制算法下，人眼对光晕效应的感知效果。实验结果表明，Mini-LED背光分块大小和调制算法对光晕效应有显著性影响，而LCD对比度对光晕效应感知无显著性影响。随着Mini-LED背光分块大小的增大，光晕效应显著增强。背光分块视角在0.5°及以上时，受测者能够较容易地感知到光晕效应。同时，主观实验结果和客观评价结果具有较高线性相关性。研究结果可为Mini-LED背光LCD显示系统的设计提供理论参考。

成像系统 Mini-LED背光局部调光光晕效应视觉感知

PDF全文 Full Text

激光与光电子学进展

2023, 60(12): 1211004

成像系统

基于CNN-SVR的立体图像视觉感知评价方法特邀研究论文

徐源陈纯毅 ^*胡小娟于海洋田野

作者单位

摘要

长春理工大学计算机科学技术学院，吉林长春 130022

针对立体图像的多维影响因素和预测结果准确性不足的问题，提出一种基于卷积神经网络-支持向量回归（CNN-SVR）的立体图像视觉感知客观评价模型。该模型将基于颜色的平面显著图和基于差异的视差图相结合，对其进行阈值分割，得到视觉感知潜在显著不适区域；然后进行特征提取，分别提取对比度、颜色、结构复杂度等全局特征和视差、纹理、空间频率等局部特征；最后采用将CNN和SVR相结合的方式构建多特征视觉感知客观评价模型，得到最终的客观预测值。实验结果表明，所提方法的Pearson相关系数高于0.87，Spearman相关系数高于0.83。与现有其他方法相比，在公开数据集上所提客观评价模型更优，预测结果与人们主观评价结果具有更高的一致性。

立体图像视觉感知特征提取卷积神经网络支持向量回归客观评价模型

PDF全文 Full Text

激光与光电子学进展

2023, 60(8): 0811027

研究论文

基于多判断和加权最小二乘优化的NSCT红外和可见图像融合

王贤涛 ^1,2赵金宇 ^1,*

作者单位

摘要

¹ 中国科学院长春光学精密机械与物理研究所，吉林长春 130033

² 中国科学院大学，北京 100049

为了克服传统方法的一些缺陷和单一特征提取信息的不足，在进一步提高红外和可见图像融合的同时，寻找针对不同类型特点的适应能力强的方法，提出了一种基于多判断与加权最小二乘优化（WLS）的非下采样轮廓波变换（NSCT）红外可见图像融合方法。首先，采用NSCT对图像进行多尺度分解，得到图像的低频和高频子带。其次，低频子带选择局部平方熵和修正拉普拉斯和（SML）来相互补充，在保证好的对比度下提取少量细节信息；高频子带充分考虑底层特征的重要性，选择相位一致性（PC）、局部加权修正拉普拉斯算子和（WSML）以及局部加权能量（WLE）相互补充的方式融合细节层，对其进行WLS优化，融合后的图像细节更自然，更适合人眼视觉感知。最后，对融合后的低频和高频子带进行逆变换，得到融合图像。对不同类型特点的图像进行了实验验证，实验结果表明，与其他融合方法相比，本文方法在主观上目标显著、背景清晰、视觉效果好。在4个客观评价指标平均梯度（AG）、信息熵（IE）、空间频率（SF）、互信息（MI）中，在保证MI指标比较好的前提下，其他3个指标都处于最好的状态，尤其是对于光照均匀的camp图像，AG和SF与最好的数值相比提高了6.9%和4.8%，从而验证了本文方法的有效性。

图像融合多判断非下采样轮廓波变换加权最小二乘优化人眼视觉感知 image fusion multi-judgment non-subsampled contourlet transform weighted least squares optimization human visual perception

PDF全文 Full Text

液晶与显示

2023, 38(2): 204

研究论文

Photonic synapses with ultralow energy consumption for artificial visual perception and brain storage

Caihong Li Wen Du Yixuan Huang Jihua Zou [ ... ]Zhiming Wang

Author Affiliations

Abstract

The human visual system, dependent on retinal cells, can be regarded as a complex combination of optical system and nervous system. Artificial retinal system could mimic the sensing and processing function of human eyes. Optically stimulated synaptic devices could serve as the building blocks for artificial retinas and subsequent information transmission system to brain. Herein, photonic synaptic transistors based on polycrystalline MoS₂, which could simulate human visual perception and brain storage, are presented. Moreover, the photodetection range from visible light to near-infrared light of MoS₂ multilayer could extend human eyes’ vision limitation to near-infrared light. Additionally, the photonic synaptic transistor shows an ultrafast speed within 5 μs and ultralow power consumption under optical stimuli about 40 aJ, several orders of magnitude lower than biological synapses (50 ms and 10 fJ). Furthermore, the backgate control could act as emotional modulation of the artificial brain to enhance or suppress memory function, i.e. the intensity of photoresponse. The proposed carrier trapping/detrapping as the main working mechanism is presented for the device. In addition, synaptic functionalities including short synaptic plasticity, long synaptic plasticity and paired-pulse facilitation could be successfully simulated based on the prepared device. Furthermore, the large difference between short synaptic plasticity and long synaptic plasticity reveals the better image pre-processing function of the prepared photonic synapses. The classical Pavlovian conditioning associated with the associative learning is successfully implemented as well. Therefore, the efficient and rich functionalities demonstrate the potential of the MoS₂ synaptic device that integrates sensing-memory-preprocessing capabilities for realizing artificial neural networks with different emotions that mimic human retina and brain.The human visual system, dependent on retinal cells, can be regarded as a complex combination of optical system and nervous system. Artificial retinal system could mimic the sensing and processing function of human eyes. Optically stimulated synaptic devices could serve as the building blocks for artificial retinas and subsequent information transmission system to brain. Herein, photonic synaptic transistors based on polycrystalline MoS₂, which could simulate human visual perception and brain storage, are presented. Moreover, the photodetection range from visible light to near-infrared light of MoS₂ multilayer could extend human eyes’ vision limitation to near-infrared light. Additionally, the photonic synaptic transistor shows an ultrafast speed within 5 μs and ultralow power consumption under optical stimuli about 40 aJ, several orders of magnitude lower than biological synapses (50 ms and 10 fJ). Furthermore, the backgate control could act as emotional modulation of the artificial brain to enhance or suppress memory function, i.e. the intensity of photoresponse. The proposed carrier trapping/detrapping as the main working mechanism is presented for the device. In addition, synaptic functionalities including short synaptic plasticity, long synaptic plasticity and paired-pulse facilitation could be successfully simulated based on the prepared device. Furthermore, the large difference between short synaptic plasticity and long synaptic plasticity reveals the better image pre-processing function of the prepared photonic synapses. The classical Pavlovian conditioning associated with the associative learning is successfully implemented as well. Therefore, the efficient and rich functionalities demonstrate the potential of the MoS₂ synaptic device that integrates sensing-memory-preprocessing capabilities for realizing artificial neural networks with different emotions that mimic human retina and brain.

MoS2 synaptic transistors visual perception ultralow power consumption memory

PDF全文 Full Text

Opto-Electronic Advances

2022, 5(9): 210069

研究论文

显示系统图像引擎的自适应色彩优化算法

张博文夏振平 ^*周波宋玉 [ ... ]柏溢

作者单位

摘要

苏州科技大学电子与信息工程学院，江苏苏州 215009

图像引擎通过多种特定的算法对图像信号进行优化，在显示系统中具有极其重要的作用和地位。图像引擎中的传统色彩优化算法由多种图像算法组合而成，存在无法进行自适应优化、容易放大图像噪声等问题。为此，提出了一种基于空洞卷积的全卷积神经网络用于构建优化算法，侧重于从人眼主观感知的角度优化图像色彩。同时，有针对性地构建大规模数据集以提高算法的泛化能力，防止过拟合。测试结果表明，所提出的算法可以有效地增强原始图像的色彩，相较于传统方法，平均峰值信噪比提升了4.01 dB，平均结构相似性提升了0.04。主观对比实验结果表明，提出的算法对图像主观感知质量有显著性影响，平均提升了61%。

图像引擎色彩优化算法深度学习图像质量视觉感知 image engine color optimization algorithm deep learning image quality visual perception

PDF全文 Full Text

液晶与显示

2022, 37(11): 1467

机器视觉

基于Mask R-CNN实例分割及FPFH特征配对的喷涂工件识别方法特邀研究论文

下载：582次

葛俊辉 ¹王健 ¹彭以平 ¹李婕瑄 ¹[ ... ]刘勇 ^2,*

作者单位

摘要

¹ 湖南大学电气与信息工程学院，湖南长沙 410082

² 浙江同济科技职业学院，浙江杭州 311231

工件识别在柔性化机器人自动喷涂生产线中至关重要，它是机器人切换喷涂轨迹的重要依据。然而，实际应用中，由于喷涂工件尺寸和种类的多样性、表面的弱纹理性、多视异构件及相似件等情况的存在，准确且高效识别喷涂工件充满挑战性。为此，提出了一种二维（2D）实例分割与三维特征一致性配对的识别方法，即利用基于小样本训练的Mask R-CNN深度模型对2D工件分割及识别的快速性，再结合fast point feature histogram（FPFH）点云特征对局部细节的强区分性，实现对多视异构件及相似件由粗到精的准确识别。在精识别阶段，提出了一种基于FPFH特征配对的识别方法。该方法以intrinsic shape signature为工件的关键点，以FPFH为矢量特征，通过线性相关度配对FPFH特征，再以拓扑结构及空间变换关系的一致性为约束验证特征的匹配率，以此作为工件识别的评价标准。实验中，采用34种类别1500多个工件进行测试，所提方法的识别率高达99.26%，单工件识别耗时低于1500 ms。

机器视觉三维视觉感知工件识别 Mask R-CNN fast point feature histogram特征配对

PDF全文 Full Text

激光与光电子学进展

2022, 59(14): 1415016

机器视觉

深度自适应动态神经网络进展综述特邀综述

下载：1289次

孙毅李健 ^*徐昕 ^**王宇茹

作者单位

摘要

国防科技大学智能科学学院，湖南长沙 410000

深度神经网络极大地推动了视觉感知与自然语言处理任务的发展，但当前大多数深度模型执行的是静态推理图，即网络结构（深度）在推理阶段固定不变。这种静态推理模式使模型无法根据输入样本的特性（如复杂度）自适应地调节深度，无法平衡模型推理效率和预测精度。因此以深度自适应神经网络为代表的动态神经网络近年来引起了广泛的关注，该类神经网络能够根据输入样本的复杂度自动地调节推理深度。从三个角度对现有工作进行系统性的归纳总结：深度自适应网络的结构设计；样本复杂度估计方法的研究；深度自适应神经网络的训练方法。最后讨论了该方向未来有价值的问题。

动态神经网络深度神经网络深度自适应样本复杂度视觉感知

PDF全文 Full Text

激光与光电子学进展

2022, 59(14): 1415008

关于本站 Cookie 的使用提示

全站搜索

热点聚焦

学术活动

关于本站 Cookie 的使用提示

全站搜索