三维空间中不同线索对物体深度感知的影响 下载: 1102次
1 引言
随着三维(3D)显示技术的发展,头戴式虚拟现实(VR)和增强现实(AR)产品、3D影院、立体显示器已经被广泛应用于游戏、医疗、灾害监控、电影娱乐等各个领域。为了增强体验感,用户在虚拟3D空间中行走和互动的需求也与日俱增。如何能让用户在虚拟的三维空间中获得真实准确的深度感知,是3D显示技术发展的关键。
在三维空间中,人眼一般通过双目视差或者运动像差线索来感知物体的深度信息[1-2]。双目视差是指人的左右两眼在水平方向上分开一定的距离(6 cm左右)后,会导致立体空间中不同深度的点在左右眼视网膜上的成像位置不同,视觉信息处理的神经中枢——大脑根据左、右眼视网膜上提取到的物体成像位置差异来判断物体的三维空间位置,从而产生深度感知[3]。运动像差是指当人体或者被观察的物体在3D空间中运动时,人眼视网膜上被观察物体的成像位置发生改变,从而产生深度感知。
物体在3D空间移动时,人眼的双目视差和运动像差通常会发生改变[4-5]。前人已经研究过观察者或者被观察物体在深度方向的移动对人眼深度感知的影响,发现不管是在远距离还是近距离观察条件下,人眼对深度的感知都会比实际深度值大[6-7]。但是,在双目视差和运动像差相结合的情况下,在不同的观察距离下,人眼如何感知3D深度在笔者检索范围内还未见报道。为此,本文基于被试者在三维空间中的运动,通过实验分析单个深度感知线索以及两个深度线索共同作用时的深度感知情况。同时,构建了较为复杂、也更能真实地反映三维空间的实际应用场景的视觉研究实验,以期为三维空间游戏场景构建、虚拟现实和增强现实眼镜设计、3D电影制作等提供理论支持和数据支撑。
2 基本原理
2.1 双目视差
当观看立体空间不同深度的点
式中:
在机器视觉或者立体显示技术中构建基于双目视差的三维信息时,可以将左、右眼的图像错开一定的位置,经过双目视觉融合产生3D效果。如
2.2 运动像差
运动像差通过物体或者被试者运动来产生深度感知,其原理是:不管是物体运动还是被试者运动,都会造成被观察物体在视网膜上成像位置的变化。人脑根据视网膜上成像位置变化的快慢来感知物体的深度。通常认为三维空间深度(距离)较近的物体在视网膜上的成像位置变化较快;相反,三维空间深度(距离)较远的物体在视网膜上的成像位置变化较慢。比如,当人们坐在行驶的火车中观察窗外的景色时,会感觉到近处的站台运动得较快,而远处的山脉运动得较慢,这就是运动像差的一个典型例子。
运动像差通常有两类情况:1)被观察物体不动,观察者从
图 3. 运动像差数学表示示意图。(a)被观察物体保持不动,观察者从H 1移动到H 2;(b)观察者从H 1移动 到H 2,被观察物体从A 点移动到B 点
Fig. 3. Mathematic schematics of motion parallax. (a) Object keeps static, and observer moves from H 1 to H 2; (b) observer moves from H 1 to H 2, and object moves from A to B
2.3 深度感知模型
在实际的3D环境中,人眼深度感知可能源于多种不同的线索,比如双目视差、运动像差、纹理、阴影等,人眼在不同线索的共同作用下感知深度信息[10-13]。关于不同的线索共同作用时如何影响人眼的深度感知,之前的研究者提出了弱融合和强融合两种可能的模式[10,14]。弱融合是指各线索之间对深度感知的影响基本是相互独立的;而强融合是指各线索之间互相有联系,可对深度感知产生交互作用。其中,比较有影响力的是改进的弱融合模型,即不同线索对深度感知的作用是接近于相互独立的,因此各线索对深度感知的影响符合线性模型[10-13]:
式中:
在改进的弱融合模型的基础上,Young等[14]通过扰动分析法分析了纹理线索和运动像差线索对深度感知的影响。实验结果表明:纹理线索和运动像差线索对深度的感知存在着线性加权的关系;而且,当其中一个线索受到噪声影响时,另一个未受到影响的线索的权重会变大[15]。
从生理物理学的角度来讲,不同的深度感知线索会在大脑的不同视觉区域产生响应。比如,双目视差信号主要在大脑的初级视皮层V1区域产生响应,运动线索主要在VT/MT区域产生响应,而物体形状认知主要发生在V4区域[16]。不同的大脑区域之间可能会有一定程度的交互作用,但是相比于每个线索的特定响应区域来讲,该交互作用较为微弱。
为了研究双目视差和运动像差的交互作用对人眼深度感知的影响,参照前人提出的线性加权模型,拟建立基于双目视差和运动像差两因素的线性模型,即
式中:
3 实验设计
3.1 实验装置
实验在暗室中进行。采用MATLAB和Psychotoolbox编程生成刺激物。在远距离观察条件下,使用3D DLP投影仪(DepthQ-WXGA,InFocus公司,美国,分辨率1024 pixel×768 pixel,刷新频率120 Hz)和投影屏幕(ES-120W,KIC公司,日本)呈现刺激物;在近距离观察条件下,使用CRT显示器(FlexScan T961,EIZO公司,日本,分辨率1024 pixel×768 pixel,刷新频率120 Hz)呈现刺激物。被试者通过液晶开关眼镜(60GX,NuVision公司,美国)观看3D图像,对观察到的深度信息进行判断,并通过无线键盘(SRTK01,BUFFALO公司,日本)特定的按键作出选择。实验过程中,通过被试者随身佩戴的磁石式3D位置测量装置(FASTRAK,POLHEMUS公司,美国)实时测量被试者的实际位置。
3.2 实验刺激和被试者
实验的刺激物为分布在黑色背景上的白色随机点。双目视差的3D刺激物呈现方式为:通过视差计算,将左右眼的图像错开一定的位置,以生成特定深度的3D柱形面。运动像差的3D刺激物呈现方式为:通过像差计算,要求被试者在规定的时间内完成指定距离的往复移动。采用随机点作为刺激物可以有效排除其他线索对深度感知的影响[15]。
在远距离观察条件下,半圆柱面的尺寸为18 cm(纵向)×36 cm(横向),深度为9 cm[
在近距离实验条件下,半圆柱面的尺寸为6 cm(纵向)×12 cm(横向),深度为3 cm[
图 4. 实验刺激物。(a)远距离观察;(b)近距离观察
Fig. 4. Stimuli in experiments. (a) Far-distance viewing; (b) near-distance viewing
实验由8名(4名男性,4名女性,平均年龄22.5岁)被试者完成。所有被试者均具有正常视力或者矫正至正常视力。在实验前,所有被试者都需通过定制的立体视觉测试软件的测试,以证明其具有正常的立体视觉,并且立体视觉的敏锐度可达到1 arcmin,不符合要求者将不能参加实验。所有被试者均充分理解实验说明,并签署同意实验的说明书。
3.3 实验1:远距离观察实验
在远距离观察实验中,被试者从270 cm的观察距离移动到180 cm的观察距离,判断在哪种观察距离下看到的柱形面的深度较大,并根据实验指定按键进行选择。实验分为双目视差实验、运动像差实验、双目视差与运动像差同时提示三种情况。
3.3.1 双目视差
实验过程如
图 5. 远距离观察实验过程示意图。(a)双目视差;(b)运动像差;(c)双目视差和运动像差
Fig. 5. Schematics of experimental processes under far-distance viewing condition. (a) Binocular parallax; (b) motion parallax; (c) binocular parallax and motion parallax
实验采用固定刺激值法,前后两次出现的柱形面深度,其中之一为固定值9.0 cm,而另一次出现的深度值为4.5,6.0,7.5,9.0,10.5,12.0,13.5 cm中的一个。固定值出现的次序(运动前还是运动后)以及7种深度值都是随机出现的,被试者无法预测下一次将会出现哪种深度值的柱形面。每名被试者在每种深度值情况下要进行20次实验,总计20×7=140次。实验分两组在不同日期完成。
在被试者移动过程中,磁石式3D位置测量装置会实时获取被试者的位置并将坐标位置显示在显示屏上,被试者可以根据当前位置及时调整运动情况。同时,为了准确控制被试者的移动位置,在实验场地悬挂导引带,以确保在暗室情况下被试者仍可以按照规定的路线和距离进行移动。每组实验前,被试者都需要按照实验要求进行练习,直到可以熟练地掌握行进路线和实验节奏,方可正式开始实验。
3.3.2 运动像差
实验中,为了观察运动像差并排除双目视差的影响,通过编程控制立体眼镜中刺激物的呈现,使得被试者正常睁开双眼并通过立体眼镜观看时,只有一只眼睛能观察到刺激物。实验过程与双目视差的不同之处在于,被试者需要通过自身位置移动来感知深度信息。具体过程如
被试者的任务以及实验方法与3.3.1节双目视差实验相同。
3.3.3 双目视差与运动像差同时提示
在实际的3D环境中,通常是既有双目视差又有运动像差。本实验旨在验证在两种深度线索同时存在的情况下,人眼如何感知3D深度信息。实验过程如
3.4 实验2:近距离观察实验
近距离观察实验中,被试者从90 cm的观察距离移动到60 cm,判断在哪种观察距离下看到的柱形面的深度较大,并根据实验指定的按键作出选择。实验分为双目视差、运动像差、双目视差与运动像差同时提示三种情况[
图 6. 近距离观察实验过程示意图。(a)双目视差;(b)运动像差;(c)双目视差和运动像差
Fig. 6. Schematics of experimental processes under near-distance viewing condition. (a) Binocular parallax; (b) motion parallax; (c) binocular parallax and motion parallax
4 分析与讨论
4.1 数据分析
通过分析主观等价点(PSE)来判断被试者在运动前后深度感知的变化。PSE是指与指定值(如实验1的中间值9.0 cm或实验2的中间值3.0 cm)有相同主观感知的数值点。如果PSE比指定值大,说明主观感知偏小,实际需要更大的值才能获得与指定值一致的主观感知;反之,如果PSE比指定值小,说明主观感知偏大。根据实验结果分别获取远距离和近距离观察条件下的实际深度感知数据,并以9.0 cm或者3.0 cm作为基准对深度感知数据进行归一化,提取每种情况对应的PSE。实验结果如
图 7. 被试者移动后深度感知的PSE分布。(a)远距离观察;(b)近距离观察(p <0.05)
Fig. 7. PSEs of depth perception before and after subjective motions.(a) Far-distance viewing; (b) near-distance viewing (p <0.05)
实验结果表明,在远距离观察条件下,运动像差条件下的PSE值为0.94,双目视差条件下的PSE值为0.97,运动像差和双目视差同时提示条件下的PSE值为0.96。在三种条件下均存在PSE<1的情况,表明在远距离观察条件下存在深度感知过大判断的特点。ANOVA分析结果显示,不同线索(运动像差、双目视差、双目视差和运动相差同时提示三种情况)的PSE之间不存在显著性差异(
在近距离观察条件下,运动像差条件下的PSE值为0.92,双目视差条件下的PSE值为1.04,运动像差和双目视差同时提示条件下的PSE值为1.06。在运动视差条件下PSE<1,表明在近距离运动时,存在深度感知过大判断的特点;而在双目视差条件,以及运动像差和双目视差同时提示的条件下,PSE>1,说明存在深度感知过小判断的特点,而且运动像差和双目视差同时提示时会进一步降低深度感知值。此外,运动像差和双目视差之间不存在线性加权关系。ANOVA分析结果显示,不同线索(运动像差、双目视差、运动像差+双目视差三种情况)的PSE之间存在显著性差异(
4.2 讨论
在远距离观察条件下,运动像差线索比双目视差线索更易产生过大的深度感知;在运动像差和双目视差两个线索同时作用的情况下,双目视差线索对深度感知占有更大的权重;说明在远距离观察条件下,双目视差线索起主导作用。
在近距离观察条件下,运动像差线索易产生过大的深度感知,双目视差线索易产生过小的深度感知;在运动像差和双目视差两个线索同时作用的情况下,深度感知并不存在线性加权的关系,而是运动像差和双目视差之间产生了相互抑制,造成更小的主观深度感知。由此可见,运动像差和双目视差之间并不是线性叠加关系,两者也不是相互独立的,而是可以相互影响的。
此外,除了运动像差线索和双目视差线索,本实验中3D感知的轮廓线索也可能存在,可能会对深度感知产生一定的影响。接下来,将会隐藏3D形状轮廓,募集更多的被试者,进一步开展3D深度感知研究。
5 结论
结合人体常在三维空间中运动的实际使用场景,分别从远距离和近距离观察条件下,对被试者在运动像差线索、双目视差线索,以及运动像差和双目视差两种线索同时作用时的深度感知及其关系进行研究分析。实验结果显示,在远距离观察条件下,运动像差线索比双目视差线索更易产生过大的深度感知;而且在远距离观察条件下,运动像差线索对深度感知的权重比在近距离观察条件下大。在近距离观察条件下,运动像差线索易产生过大的深度感知,双目视差线索易产生过小的深度感知;两种线索同时作用对深度感知并不存在线性加权的关系,也没有相互促进作用,并且此时运动像差的线索对深度感知的作用较小。上述结果对于3D空间游戏场景构建、虚拟现实和增强现实眼镜设计、3D电影制作等实际应用具有指导作用。
[1] Howard IP, Rogers BJ. Perceiving in depth, volume 2: stereoscopic vision[M]. New York: Oxford University Press, 2012: 385- 432.
[2] Howard IP, Rogers BJ. Perceiving in depth, volume 3: other mechanisms of depth perception[M]. New York: Oxford University Press, 2012: 63- 83.
[3] SnowdenR, ThompsonP, TrosciankoT. Basic vision: an introduction to visual perception[M]. New York: Oxford University Press, 2012: 220- 222.
[4] Howard IP, Rogers BJ. Perceiving in depth, volume 1: basic mechanisms[M]. New York: Oxford University Press, 2012: 435- 474.
[5] Howard IP, Rogers BJ. Binocular vision and stereopsis[M]. New York: Oxford University Press, 1995: 108- 121.
[15] JuleszB. Foundations of cyclopean perception[M]. Chicago: University of Chicago Press, 1971: 142- 148.
[16] Li ZP. Understanding vision: theory, models, and data[M]. New York: Oxford University Press, 2014: 16- 66.
Article Outline
贺书芳, 繁桝博昭, 石川祐記子, 代彩红. 三维空间中不同线索对物体深度感知的影响[J]. 光学学报, 2019, 39(10): 1033002. Shufang He, Hiroaki Shigemasu, Yukiko Ishikawa, Caihong Dai. Depth Perception with Different Cues in Three-Dimensional Space[J]. Acta Optica Sinica, 2019, 39(10): 1033002.