光学学报, 2019, 39 (10): 1033002, 网络出版: 2019-10-09  

三维空间中不同线索对物体深度感知的影响 下载: 1102次

Depth Perception with Different Cues in Three-Dimensional Space
作者单位
1 中国计量科学研究院光学与激光计量科学研究所, 北京 100029
2 高知工科大学研究生院, 日本 高知 7828502
3 高知工科大学信息学院, 日本 高知 7828502
摘要
通过在虚拟三维空间中构建基于双目视差和运动像差的不同深度的柱形面,使被试者在三维空间中行走运动,采用心理物理学的固定值刺激法,获取被试者在不同观察距离下基于双目视差线索、运动像差线索,以及两种线索同时作用时的深度感知数据,研究双目视差线索和运动像差线索对人眼深度感知的影响。结果表明:在不同的观察距离下,双目视差线索和运动像差线索对人眼的深度感知有不同的影响;在远距离观察条件下,运动像差线索对深度感知的权重比在近距离观察条件下大;而在近距离观察条件下,两种线索同时作用时对深度感知没有促进作用,并且运动像差线索对深度感知的作用较小。
Abstract
By using the method of constant stimuli, binocular-disparity based and motion-parallax based cylinders with various depths were produced in three-dimensional space as experimental stimuli. Observers were asked to walk in the three-dimensional space, and depth perception data at different viewing distances were obtained by using binocular-disparity cue, motion-parallax cue, and both binocular-disparity and motion-parallax cues separately. The experimental results show: at different viewing distances, binocular-disparity and motion-parallax cues have different influences on depth perception. In the far-distance viewing condition, the weight of motion parallax cue in depth perception is relatively larger than that in the near-distance viewing condition; in the near-distance viewing condition, when binocular-disparity and motion-parallax cues are combined, there is no promotive effect in depth perception and the effect of motion parallax cue is very small.

1 引言

随着三维(3D)显示技术的发展,头戴式虚拟现实(VR)和增强现实(AR)产品、3D影院、立体显示器已经被广泛应用于游戏、医疗、灾害监控、电影娱乐等各个领域。为了增强体验感,用户在虚拟3D空间中行走和互动的需求也与日俱增。如何能让用户在虚拟的三维空间中获得真实准确的深度感知,是3D显示技术发展的关键。

在三维空间中,人眼一般通过双目视差或者运动像差线索来感知物体的深度信息[1-2]。双目视差是指人的左右两眼在水平方向上分开一定的距离(6 cm左右)后,会导致立体空间中不同深度的点在左右眼视网膜上的成像位置不同,视觉信息处理的神经中枢——大脑根据左、右眼视网膜上提取到的物体成像位置差异来判断物体的三维空间位置,从而产生深度感知[3]。运动像差是指当人体或者被观察的物体在3D空间中运动时,人眼视网膜上被观察物体的成像位置发生改变,从而产生深度感知。

物体在3D空间移动时,人眼的双目视差和运动像差通常会发生改变[4-5]。前人已经研究过观察者或者被观察物体在深度方向的移动对人眼深度感知的影响,发现不管是在远距离还是近距离观察条件下,人眼对深度的感知都会比实际深度值大[6-7]。但是,在双目视差和运动像差相结合的情况下,在不同的观察距离下,人眼如何感知3D深度在笔者检索范围内还未见报道。为此,本文基于被试者在三维空间中的运动,通过实验分析单个深度感知线索以及两个深度线索共同作用时的深度感知情况。同时,构建了较为复杂、也更能真实地反映三维空间的实际应用场景的视觉研究实验,以期为三维空间游戏场景构建、虚拟现实和增强现实眼镜设计、3D电影制作等提供理论支持和数据支撑。

2 基本原理

2.1 双目视差

当观看立体空间不同深度的点FQ时(图1),flql是在左眼视网膜上的成像,frqr是在右眼视网膜上的成像,则双目视差可表示为[2]

Δθ=θ1-θ2,(1)

式中:θ1表示左眼对F点和Q点在视网膜上成像的夹角;θ2表示右眼对F点和Q点在视网膜上成像的夹角。

图 1. 双目视差示意图

Fig. 1. Schematic of binocular disparity

下载图片 查看所有图片

在机器视觉或者立体显示技术中构建基于双目视差的三维信息时,可以将左、右眼的图像错开一定的位置,经过双目视觉融合产生3D效果。如图2所示,当双眼同时注视P点时,左右眼的图像位置满足L0=R0,此时物体的深度为d;当要产生更远的深度感知时,可以将左右眼图像位置分别移动至L1R1,大脑会将左右眼图像融合并产生d1的深度感知;当要产生较近的深度感知时,可以将左右眼图像分别移动至L2R2,大脑会将左右眼图像融合并产生d2的深度感知。通过编程计算可以精确地控制L1R1的位置,以生成不同深度、不同形状的3D物体。

图 2. 双目视差产生的原理示意图

Fig. 2. Schematic of binocular disparity generation

下载图片 查看所有图片

2.2 运动像差

运动像差通过物体或者被试者运动来产生深度感知,其原理是:不管是物体运动还是被试者运动,都会造成被观察物体在视网膜上成像位置的变化。人脑根据视网膜上成像位置变化的快慢来感知物体的深度。通常认为三维空间深度(距离)较近的物体在视网膜上的成像位置变化较快;相反,三维空间深度(距离)较远的物体在视网膜上的成像位置变化较慢。比如,当人们坐在行驶的火车中观察窗外的景色时,会感觉到近处的站台运动得较快,而远处的山脉运动得较慢,这就是运动像差的一个典型例子。

运动像差通常有两类情况:1)被观察物体不动,观察者从H1移动到H2的位置[图3(a)];2)观察者从H1移动到H2的位置,同时被观察物体从A点移动到B点[图3(b)]。与双目视差不同的是,运动像差是一种单眼线索[2]。之前的研究者们分别通过使被观察物体运动、被试者不动,或者被观察物体不动、被试者运动来产生运动像差,并且通过控制视网膜成像位置变化的速度来改变运动像差[8-9]

图 3. 运动像差数学表示示意图。(a)被观察物体保持不动,观察者从H1移动到H2;(b)观察者从H1移动 到H2,被观察物体从A点移动到B

Fig. 3. Mathematic schematics of motion parallax. (a) Object keeps static, and observer moves from H1 to H2; (b) observer moves from H1 to H2, and object moves from A to B

下载图片 查看所有图片

2.3 深度感知模型

在实际的3D环境中,人眼深度感知可能源于多种不同的线索,比如双目视差、运动像差、纹理、阴影等,人眼在不同线索的共同作用下感知深度信息[10-13]。关于不同的线索共同作用时如何影响人眼的深度感知,之前的研究者提出了弱融合和强融合两种可能的模式[10,14]。弱融合是指各线索之间对深度感知的影响基本是相互独立的;而强融合是指各线索之间互相有联系,可对深度感知产生交互作用。其中,比较有影响力的是改进的弱融合模型,即不同线索对深度感知的作用是接近于相互独立的,因此各线索对深度感知的影响符合线性模型[10-13]:

D=1nwiDi1nwi,(2)

式中:D表示总体深度;i表示不同的线索;wi表示每个线索的权重;Di表示不同线索感知到的深度值。

在改进的弱融合模型的基础上,Young等[14]通过扰动分析法分析了纹理线索和运动像差线索对深度感知的影响。实验结果表明:纹理线索和运动像差线索对深度的感知存在着线性加权的关系;而且,当其中一个线索受到噪声影响时,另一个未受到影响的线索的权重会变大[15]

从生理物理学的角度来讲,不同的深度感知线索会在大脑的不同视觉区域产生响应。比如,双目视差信号主要在大脑的初级视皮层V1区域产生响应,运动线索主要在VT/MT区域产生响应,而物体形状认知主要发生在V4区域[16]。不同的大脑区域之间可能会有一定程度的交互作用,但是相比于每个线索的特定响应区域来讲,该交互作用较为微弱。

为了研究双目视差和运动像差的交互作用对人眼深度感知的影响,参照前人提出的线性加权模型,拟建立基于双目视差和运动像差两因素的线性模型,即

S=wBSB+wMSM,(3)

式中:SBSM分别表示双眼视差和运动像差;wBwM分别表示双眼视差和运动像差的权重,wB+wM=1。

3 实验设计

3.1 实验装置

实验在暗室中进行。采用MATLAB和Psychotoolbox编程生成刺激物。在远距离观察条件下,使用3D DLP投影仪(DepthQ-WXGA,InFocus公司,美国,分辨率1024 pixel×768 pixel,刷新频率120 Hz)和投影屏幕(ES-120W,KIC公司,日本)呈现刺激物;在近距离观察条件下,使用CRT显示器(FlexScan T961,EIZO公司,日本,分辨率1024 pixel×768 pixel,刷新频率120 Hz)呈现刺激物。被试者通过液晶开关眼镜(60GX,NuVision公司,美国)观看3D图像,对观察到的深度信息进行判断,并通过无线键盘(SRTK01,BUFFALO公司,日本)特定的按键作出选择。实验过程中,通过被试者随身佩戴的磁石式3D位置测量装置(FASTRAK,POLHEMUS公司,美国)实时测量被试者的实际位置。

3.2 实验刺激和被试者

实验的刺激物为分布在黑色背景上的白色随机点。双目视差的3D刺激物呈现方式为:通过视差计算,将左右眼的图像错开一定的位置,以生成特定深度的3D柱形面。运动像差的3D刺激物呈现方式为:通过像差计算,要求被试者在规定的时间内完成指定距离的往复移动。采用随机点作为刺激物可以有效排除其他线索对深度感知的影响[15]

在远距离观察条件下,半圆柱面的尺寸为18 cm(纵向)×36 cm(横向),深度为9 cm[图4(a)]。实验过程中,被试者从270 cm的观察距离运动至180 cm距离处。在双目视差情况下,人眼感知4.5,6.0,7.5,9.0,10.5,12.0,13.5 cm深度的柱形曲面;在运动像差情况下,人体在水平方向移动的距离为45 cm。

在近距离实验条件下,半圆柱面的尺寸为6 cm(纵向)×12 cm(横向),深度为3 cm[图4(b)]。实验过程中,被试者从90 cm的观察距离运动至60 cm距离处。在双目视差情况下,人眼感知1.5,2.0,2.5,3.0,3.5,4.0,4.5 cm深度的柱形曲面;在运动像差情况下,人体在水平方向移动的距离为15 cm。

图 4. 实验刺激物。(a)远距离观察;(b)近距离观察

Fig. 4. Stimuli in experiments. (a) Far-distance viewing; (b) near-distance viewing

下载图片 查看所有图片

实验由8名(4名男性,4名女性,平均年龄22.5岁)被试者完成。所有被试者均具有正常视力或者矫正至正常视力。在实验前,所有被试者都需通过定制的立体视觉测试软件的测试,以证明其具有正常的立体视觉,并且立体视觉的敏锐度可达到1 arcmin,不符合要求者将不能参加实验。所有被试者均充分理解实验说明,并签署同意实验的说明书。

3.3 实验1:远距离观察实验

在远距离观察实验中,被试者从270 cm的观察距离移动到180 cm的观察距离,判断在哪种观察距离下看到的柱形面的深度较大,并根据实验指定按键进行选择。实验分为双目视差实验、运动像差实验、双目视差与运动像差同时提示三种情况。

3.3.1 双目视差

实验过程如图5(a)所示,在实验开始前,被试者手持无线键盘站在270 cm位置。当被试者准备好后,按键盘指定的开始键(如数字键“5”)触发刺激,具有一定深度的3D柱形面将会显示在屏幕上。被试者观察柱形面的深度后,开始向屏幕方向移动至180 cm的距离位置(到达指定位置后,被试者会收到声音提示信息)。站定之后,被试者再次按下开始键触发刺激,具有一定深度的3D柱形面将会显示在屏幕上。被试者的任务是,判断哪个观察距离下柱形面的深度较大,并通过键盘上不同的按键进行选择(比如:如果被试者觉得第一次出现的柱形面深度大,就选择键盘按键“4”;如果觉得第二次出现的柱形面的深度大,则选择键盘按键“6”)。

图 5. 远距离观察实验过程示意图。(a)双目视差;(b)运动像差;(c)双目视差和运动像差

Fig. 5. Schematics of experimental processes under far-distance viewing condition. (a) Binocular parallax; (b) motion parallax; (c) binocular parallax and motion parallax

下载图片 查看所有图片

实验采用固定刺激值法,前后两次出现的柱形面深度,其中之一为固定值9.0 cm,而另一次出现的深度值为4.5,6.0,7.5,9.0,10.5,12.0,13.5 cm中的一个。固定值出现的次序(运动前还是运动后)以及7种深度值都是随机出现的,被试者无法预测下一次将会出现哪种深度值的柱形面。每名被试者在每种深度值情况下要进行20次实验,总计20×7=140次。实验分两组在不同日期完成。

在被试者移动过程中,磁石式3D位置测量装置会实时获取被试者的位置并将坐标位置显示在显示屏上,被试者可以根据当前位置及时调整运动情况。同时,为了准确控制被试者的移动位置,在实验场地悬挂导引带,以确保在暗室情况下被试者仍可以按照规定的路线和距离进行移动。每组实验前,被试者都需要按照实验要求进行练习,直到可以熟练地掌握行进路线和实验节奏,方可正式开始实验。

3.3.2 运动像差

实验中,为了观察运动像差并排除双目视差的影响,通过编程控制立体眼镜中刺激物的呈现,使得被试者正常睁开双眼并通过立体眼镜观看时,只有一只眼睛能观察到刺激物。实验过程与双目视差的不同之处在于,被试者需要通过自身位置移动来感知深度信息。具体过程如图5(b)所示:当被试者站在270 cm位置并准备好后,按键盘指定的开始键(如数字键“5”)触发刺激,被试者需要在规定的时间内在45 cm范围内左右移动一个来回,由此运动视差产生3D深度感知。被试者观察了柱形面的深度后,开始向屏幕方向移动至180 cm的观察位置(到达指定位置后,被试者会收到提示信息)。站定之后,被试者再次按下开始键触发刺激,并在同样的时间内在45 cm范围内左右移动一个来回以感知3D深度信息。

被试者的任务以及实验方法与3.3.1节双目视差实验相同。

3.3.3 双目视差与运动像差同时提示

在实际的3D环境中,通常是既有双目视差又有运动像差。本实验旨在验证在两种深度线索同时存在的情况下,人眼如何感知3D深度信息。实验过程如图5(c)所示,与3.3.2节运动像差实验过程的不同之处在于,被试者的双眼能同时看到刺激物(而不是一只眼睛);与此同时,被试者还需要完成与3.3.2节运动像差实验中相同的身体运动,以获取最终的3D深度感知信息。被试者的任务以及实验方法与前述实验相同。

3.4 实验2:近距离观察实验

近距离观察实验中,被试者从90 cm的观察距离移动到60 cm,判断在哪种观察距离下看到的柱形面的深度较大,并根据实验指定的按键作出选择。实验分为双目视差、运动像差、双目视差与运动像差同时提示三种情况[图6(a)~(c)]。实验过程分别与3.3.1~3.3.3节相同,在此省略。与远距离观察实验不同的是,在双目视差实验中,人眼感知的柱形面的深度为1.5,2.0,2.5,3.0,3.5,4.0,4.5 cm;在运动像差实验中,被试者左右移动的距离是15 cm。

图 6. 近距离观察实验过程示意图。(a)双目视差;(b)运动像差;(c)双目视差和运动像差

Fig. 6. Schematics of experimental processes under near-distance viewing condition. (a) Binocular parallax; (b) motion parallax; (c) binocular parallax and motion parallax

下载图片 查看所有图片

4 分析与讨论

4.1 数据分析

通过分析主观等价点(PSE)来判断被试者在运动前后深度感知的变化。PSE是指与指定值(如实验1的中间值9.0 cm或实验2的中间值3.0 cm)有相同主观感知的数值点。如果PSE比指定值大,说明主观感知偏小,实际需要更大的值才能获得与指定值一致的主观感知;反之,如果PSE比指定值小,说明主观感知偏大。根据实验结果分别获取远距离和近距离观察条件下的实际深度感知数据,并以9.0 cm或者3.0 cm作为基准对深度感知数据进行归一化,提取每种情况对应的PSE。实验结果如图7所示,其中,图7(a)、(b)所示分别为远距离和近距离观察条件下8名被试者移动后深度感知的PSE分布。之后,对实验数据进行方差分析(ANOVA)。

图 7. 被试者移动后深度感知的PSE分布。(a)远距离观察;(b)近距离观察(p<0.05)

Fig. 7. PSEs of depth perception before and after subjective motions.(a) Far-distance viewing; (b) near-distance viewing (p<0.05)

下载图片 查看所有图片

实验结果表明,在远距离观察条件下,运动像差条件下的PSE值为0.94,双目视差条件下的PSE值为0.97,运动像差和双目视差同时提示条件下的PSE值为0.96。在三种条件下均存在PSE<1的情况,表明在远距离观察条件下存在深度感知过大判断的特点。ANOVA分析结果显示,不同线索(运动像差、双目视差、双目视差和运动相差同时提示三种情况)的PSE之间不存在显著性差异(p=0.87)。对运动像差和双目视差的深度感知进行线性加权计算,可以得到在远距离观察条件下,权重wB=0.33,wB=0.67,即Sfar=0.67SB+0.33SM

在近距离观察条件下,运动像差条件下的PSE值为0.92,双目视差条件下的PSE值为1.04,运动像差和双目视差同时提示条件下的PSE值为1.06。在运动视差条件下PSE<1,表明在近距离运动时,存在深度感知过大判断的特点;而在双目视差条件,以及运动像差和双目视差同时提示的条件下,PSE>1,说明存在深度感知过小判断的特点,而且运动像差和双目视差同时提示时会进一步降低深度感知值。此外,运动像差和双目视差之间不存在线性加权关系。ANOVA分析结果显示,不同线索(运动像差、双目视差、运动像差+双目视差三种情况)的PSE之间存在显著性差异(p=0.03)。

4.2 讨论

在远距离观察条件下,运动像差线索比双目视差线索更易产生过大的深度感知;在运动像差和双目视差两个线索同时作用的情况下,双目视差线索对深度感知占有更大的权重;说明在远距离观察条件下,双目视差线索起主导作用。

在近距离观察条件下,运动像差线索易产生过大的深度感知,双目视差线索易产生过小的深度感知;在运动像差和双目视差两个线索同时作用的情况下,深度感知并不存在线性加权的关系,而是运动像差和双目视差之间产生了相互抑制,造成更小的主观深度感知。由此可见,运动像差和双目视差之间并不是线性叠加关系,两者也不是相互独立的,而是可以相互影响的。

此外,除了运动像差线索和双目视差线索,本实验中3D感知的轮廓线索也可能存在,可能会对深度感知产生一定的影响。接下来,将会隐藏3D形状轮廓,募集更多的被试者,进一步开展3D深度感知研究。

5 结论

结合人体常在三维空间中运动的实际使用场景,分别从远距离和近距离观察条件下,对被试者在运动像差线索、双目视差线索,以及运动像差和双目视差两种线索同时作用时的深度感知及其关系进行研究分析。实验结果显示,在远距离观察条件下,运动像差线索比双目视差线索更易产生过大的深度感知;而且在远距离观察条件下,运动像差线索对深度感知的权重比在近距离观察条件下大。在近距离观察条件下,运动像差线索易产生过大的深度感知,双目视差线索易产生过小的深度感知;两种线索同时作用对深度感知并不存在线性加权的关系,也没有相互促进作用,并且此时运动像差的线索对深度感知的作用较小。上述结果对于3D空间游戏场景构建、虚拟现实和增强现实眼镜设计、3D电影制作等实际应用具有指导作用。

参考文献

[1] Howard IP, Rogers BJ. Perceiving in depth, volume 2: stereoscopic vision[M]. New York: Oxford University Press, 2012: 385- 432.

[2] Howard IP, Rogers BJ. Perceiving in depth, volume 3: other mechanisms of depth perception[M]. New York: Oxford University Press, 2012: 63- 83.

[3] SnowdenR, ThompsonP, TrosciankoT. Basic vision: an introduction to visual perception[M]. New York: Oxford University Press, 2012: 220- 222.

[4] Howard IP, Rogers BJ. Perceiving in depth, volume 1: basic mechanisms[M]. New York: Oxford University Press, 2012: 435- 474.

[5] Howard IP, Rogers BJ. Binocular vision and stereopsis[M]. New York: Oxford University Press, 1995: 108- 121.

[6] Shigemasu H, Okubo K, Yan P. Shape constancy from binocular disparity with self-motion in depth[J]. Perception ECVP, 2013, 42: 117-117.

[7] Scarfe P, Hibbard P B. Disparity-defined objects moving in depth do not elicit three-dimensional shape constancy[J]. Vision Research, 2006, 46(10): 1599-1610.

[8] Braunstein M L. Sensitivity of the observer to transformations of the visual field[J]. Journal of Experimental Psychology, 1966, 72(5): 683-689.

[9] Rogers B, Graham M. Motion parallax as an independent cue for depth perception[J]. Perception, 1979, 8(2): 125-134.

[10] Landy M S, Maloney L T, Johnston E B, et al. Measurement and modeling of depth cue combination: in defense of weak fusion[J]. Vision Research, 1995, 35(3): 389-412.

[11] Rogers B, Graham M. Similarities between motion parallax and stereopsis in human depth perception[J]. Vision Research, 1982, 22(2): 261-270.

[12] Tittle J S, Norman J F, Perotti V J, et al. The perception of scale-dependent and scale-independent surface structure from binocular disparity, texture, and shading[J]. Perception, 1998, 27(2): 147-166.

[13] Nawrot M, Blake R. The interplay between stereopsis and structure from motion[J]. Perception & Psychophysics, 1991, 49(3): 230-244.

[14] Young M J, Landy M S, Maloney L T. A perturbation analysis of depth perception from combinations of texture and motion cues[J]. Vision Research, 1993, 33(18): 2685-2696.

[15] JuleszB. Foundations of cyclopean perception[M]. Chicago: University of Chicago Press, 1971: 142- 148.

[16] Li ZP. Understanding vision: theory, models, and data[M]. New York: Oxford University Press, 2014: 16- 66.

贺书芳, 繁桝博昭, 石川祐記子, 代彩红. 三维空间中不同线索对物体深度感知的影响[J]. 光学学报, 2019, 39(10): 1033002. Shufang He, Hiroaki Shigemasu, Yukiko Ishikawa, Caihong Dai. Depth Perception with Different Cues in Three-Dimensional Space[J]. Acta Optica Sinica, 2019, 39(10): 1033002.

引用该论文: TXT   |   EndNote

相关论文

加载中...

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!