我的订单|我的收藏|我的商城|帮助中心|返回首页
虚拟现实新闻>百科>文献资料>文献论文

立体视觉差理论

文章来源:网络收集 作者:Frank 发布时间:2013年12月24日 点击数: 字号:

一、双目视觉;两种视网膜映像的差别

二、立体视镜;最简单的立体视觉实验

三、立体视觉理论一    

  我们可以把两只眼睛比做两名哨兵,他们从不同角度观察世界,彼此通报各自的经验,用观念(idea)完成一幅共同的图景,并且通过观念将每位观察者分别看到的东西联合起来。    

  双目视力(binocular)与单目视力(monocular)不同,人们发现这一事实已有很久。早期的生理学家认为由单眼产生的物体映象与由双眼产生的物体映像并无二致。因此,他们假设,双目实际上等于单目--这一结论在视神经(optic nerves)的解剖结构中得到证实。在视神经从脑部出发通往眼睛的途中,于某一地点发生沁形交叉。该地点上的神经纤维紧密交错;然后,又形成两根神经干(nerve-trunks),每一根神经干通向一只眼睛。据假设,在两种神经的×形交叉点上,神经纤维产生了分离。每一根神经纤维,不论它来自脑的哪一侧,被认为是以下列方式分离(divide)的,即它的一部分通向一只眼睛,并在每只眼睛中通往相应位置的视网膜点上。英国物理学家惠特斯通(wheatstone)于1840年证明,投射于每只眼睛视网膜上的映像(images)往往是不相同的,这种不相同并没有给视觉带来混乱。如果我们将某样东西放在靠近我们面前的地方,先闭一只眼睛,然后再闭另一只眼睛,在这先后两种情况下,我们见到的这个东西稍有不同。譬如说,我们将自己的一只手放在两眼之间,离开双目只有一点点的距离,以便使手的表面和脸部成直角;这样一来,一只眼睛只能见到手背,另一只眼睛只能见到手掌。如果解剖上的X形交叉点确是分离之处,而且如果投射于双目的映像在脑中直接相混合(intermixed),那么同时发生的双目视觉将只能为我们提供一幅混乱的图像。因为在一只眼的视网膜上反映出手背的部分,而在另一只眼的视网膜的相应区域则反映出手掌的部分。然后这两种图像参与视觉的共同活动,这样一来就会使任何一种清晰的视觉理解成为不可能的事。但是,实际的观察并未证明上述观点的正确。事实恰恰是,我们用双目看手比用单目看手可以看得更完美。原因不仅在于用双目看东西可以同时看,用单目看东西是相继地看,而且还在于我们直接感知到手并不是画在平面的一幅图画,而是第三维度(third Dimension)的延伸。我们可以用各种物体重复进行同样的试验;我们将总是发现对物体的第三维度的理解始终与同时发生的双目视觉密切联系着。如果我们只用单眼,那么我们便常常难以确定我们注视的物体究竟是三维的,还是仅仅画在平面上的一幅图画。因此,在单目注视中错觉是容易产生的;用透视法作画,其中明亮部分和阴影部分尤其可以提供第三维度的强烈印象。如果物体靠近我们,那么只要第二只眼睛一睁开,错觉便立即消失。虽然第三维度的知觉可以用单眼得到,但是它仍然是不够完整的、瞬间即逝的,而双目视觉获得的第三维度和知觉便不会这样。一般说来,我们用单目视力只能逐渐地获得物体的第三维度的知觉,并且按照眼睛由较近的注视点向较远的注视点的移动,也就是通过时间上一个接着另一个的系列活动来获得对物体的第三维度的知觉。     

如果直接的深度观念(idea of depth)始终与同时发生的双目视觉相联系的话,那么显然可以这样说,我们用此方式见到的物体正是由于投射到双目的映像是不同的缘故。我们关于第三维度延伸的直接知觉是因为双目从不同视角注视事物的缘故。而且,这一事实通过观察得到了证实。当我们把物体移向距离眼睛越来越远的地方时,深度知觉便随之消失。但是,随着距离的增长,两眼视网膜之间的差异也随之减少。直到最后,当物体已经十分遥远,以至于双目之间的距离与物体相比实际上为零时,两种映象恰好相似,并相应地投射到两眼视网膜的有关部分。譬如说,如果我们拿一张纸放在眼前,以便使右眼见到纸的一边,左眼见到纸的另一边,我们便获得该纸在第三维度中延伸的清晰观念。但是,如果将纸张移动,使之离眼睛越来越远,结果我们便越来越少地看到纸的两面;直到最后,除了纸的前缘以外便什么也看不到了,而纸的前缘对于一只眼睛和另一眼睛都是一样的。换句话说,深度知觉和两种视网膜映像之间的差异始终是彼此平行的。   

   如果双眼视网膜映像之间的这种差异是深度知觉的原因,那么很显然这种深度知觉便可以在并未实际见到三维物体的情况下产生,只要向双眼呈现具有差异的视网膜映像(这种差异与知觉这样一种物体时产生的差异相类似)便可做到。也就是说,如果我们向一个视网膜投射一个看上去很像倾斜着的手背的映像,并向另一个视网膜投射一个在相似的条件下见到的类似手掌的映像,那么在我们的头脑里便会产生第三维度延伸的观念,尽管所使用的映像只不过是一个平面上的图画而已。这些视网膜映像与我们注视一只实际的手时所反映出来的视网膜映像恰好一样,其结果也因此保持不变。    

  要测试这一点颇为容易。最好采用简单形式的目标物。假定我们将截去顶端并且具有圆形底部的锥体放在眼前,锥体的顶点朝着我们的脸部。首先,我们闹起右眼,然后画一张确切的锥体图;接着,又闹起左眼,并画类似的图画。结果,画出来的两幅图是不同的,因为右眼所看到的锥体的一些部分是左眼所看不到的,反之亦一样,左眼所看到的那个部分是右眼所看不到的。左眼看到的锥体近似于A,右眼看到的锥体类似于B(见图25)。这两幅图仅仅作为图画都无法提供任何启迪以形成第三维度的观念。我们所能做的便是通过一种想象的努力去或近或远地注视内部的小圆,而不是去注视外部的大圆。但是,如果我们让A影响左眼,好像它是一个出自实际锥体的映像,并让B对右眼施以同样的影响,那么,我们便会得到明确的三维观念,就像我们通过观察锥体本身所获得的三维观念一样。 

 

 

     

 当然,如果用双眼去看这两幅画时眼睛随意乱指是不行的。我们必须以这样一种方式去看这两幅画,这种方式与那些由实际物体来形成的映像相对立。左眼必须凝视A里面的小圆,右眼必须凝视B里面的小圆。只有在这种条件下,两只眼睛里的映像才可能像我们凝视一个真实的截去顶端的锥体顶部时所产生的那种映像。但是,这样的实验并非易事。我们习惯于将双眼指向同一点上。这里,我们必须用两只眼睛凝视一个不同的点,用左眼看A的顶部,用右眼看B的顶部。唯有经过长而持续的实践,我们才能使自己的眼睛运动控制到这样的程度,即用每一只眼睛进行独立的注视。正常情况下,双目的运动完全是同时发生的。运动本身是由外部印象决定的;也有可能这些运动最初有助于机能的同时发生(functional concurrence)。因为,正如我们已经看到的那样,这是每只眼睛的反射机制的规律(law of the reflx mechanism),即我们的凝视总是受到与众不同的地点或界线(points or boundary lines)所吸引,并根据它们引起的印象的强度(intensity)从一个地点(或界线)移动到另一个地点(或界线)。由于双眼均遵循同一条规律,它们的运动必须紧密地相互联系。引导一只眼睛去凝视它的那个地点也会吸引另一只眼睛。这样一来,就两只眼睛来说,便产生了一种共同凝视的冲动,这种共同凝视的冲动只有通过实践才能克服。  

视觉表现张力,这便是立体原理

二      为了排除仅仅把观察限制在少数有经验者的身上这一困难,惠特斯通制成了立体视镜(stereoscope)。借助这种仪器,任何一个人都可以相当容易地从一个平面上呈示的东西中获得三维观念。普通类型的立体视镜是由布鲁斯特(Brewster)提供的(见图26)。它包含两块小的呈倾斜角度的棱镜,在棱镜后面的一段距离置有可供组合的两幅图画。双目在自由注视时必须使它们的视轴平行,以便能同时注视两幅图画(b)。但是,如果中间插入两块棱镜(p),而且它们的折射角朝向彼此的眼睛,从而使得来自图画(b)的光线将以这样的方式转向,即这些光线能落在视力最清楚的地方和视网膜的邻近部分,尽管双目并不凝视着图画(b),而是凝视着f点。这样一来,其必然的结果是,A和B的内部小圆(见图25)影响两眼视网膜的重合之点(coincident points),而图 25的余下部分正好显现出视网膜映像中的同样差异,像我们直接观察一个具有类似特征的真实物体时所产生的视网膜映像的差异一样。

 

      下面是最简单的立体视镜实验。如果用立体视镜把彼此位于不同距离的两根垂直线向每只眼睛呈现的话,那么深度知觉便会产生(见图27);例如,向左眼呈现ah,向右眼呈现cd。运用这种方式,我们得到了两根垂直线的共同映像,共同映像之一,即垂直线1,是由于融合了a和c的结果,共同映像之二,即垂直线2,则是融合了b和d的结果。前者存在于纸的平面上,后者则存在于稍后一点的距离上。这是符合通常的情况的。当我们双目凝视两根线条时,右面一根线条往往比左面一根线条稍远一点,右眼视网膜映像中两根线条的水平距离必然比左眼视网膜映像中两根线条的水平距离要大一些。     

 当我们向每只眼睛呈现画得稍稍倾斜的一根线段,而且使两根线段的倾斜度稍有不同时,用这种方式同样产生了深度观念。如果线段1和r分别落入左眼和右眼上面,具有如图28所示的倾斜度,那么我们便能获得一个共同的映像(s),它延伸至第三维度,其上端比下端更远。但是,另一方面,如果线段像图四那样倾斜,我们便获得了一个共同的映像,它的下端要比上端更远。     

在上述两个事例中,倾斜的线段以不同的形式倾斜,或者说垂直线之间的水平距离有所不同。这两个事例不断地被肉眼在三维视觉的条件下认识到,同时也在立体视镜中被认识到。它们构成两种基本的立体视镜的视觉实验。垂直线或斜线无需笔直;如果它们有点弯曲结果也一样。所有立体视镜的视觉最终有赖于这两种基本实验的结合。另一方面,如果呈现不同距离的水平线,我们便无法获得深度观念了。这一现象是很容易得到解释的,因为我们记得在自然界并不存在这类三维视觉的情况。我们可以随心所欲地翻转或扭曲一个物体;它的界线不是垂直的便是倾斜的。     

 立体视镜视觉的事实无可争辩地证明了双目是彼此独立地感知的,它们的知觉只是在第二步上才结合成共同的观念。关于立体视觉现象的原因,其他任何一种观点都不可避免地涉及一些矛盾。例如,认为两只眼睛实际上仅是一只眼睛;认为每根神经纤维分成两个分支,各自通往两个视网膜的相应点上,这样的想法是绝对不可能的。如果情况真是这样的话,那么我们从截去顶端的锥体所获得的共同映像将具有图30所示的特征。在图30中,那些不投射于相应视网膜点上的图画部分干脆相互覆盖起来;而且没有产生一种简单的三维物体观念的暗示。 

      如果我们承认(正如该现象不可避免地迫使我们去承认的那样)两眼是分离的视觉器官,它们彼此独立地进行感知,那么我们便只能以某种心理过程寻求两种视知觉(visual perceptions)的融合。事实上,这一现象本身导致了这样的结论。我们认为深度观念只有在两种映像恰巧与我们对空间实际物体的看法相符合时才会产生;我们发现,第三维度的直接知觉始终意指着双目视觉。现在,假定在你面前分开展示两幅平面图画,你被告知这两幅平面图画是同一物体的两种投影(projections),那么关于这一物体的性质你会作出什么推论呢?当然,你会说,物体在三个维度中得到扩展;你甚至会拥有一个关于该物体第三维度的大体正确的观念,也许还能构筑整个物体的确切模型。如果双目知觉原本便是两个分离的东西,那么就必须通过一种基本相似的方法,它使我们最终将这两种分区(separate areal)的映像融合成在第三维度中延伸的物体的共同观念。我们也必须从物体的分区投影中构筑我们关于该物体模型的观念。唯一的差别在于我们并不是有意识地做到这一点,而是通过一种感觉联合的活动无意识地和不自觉地做到这一点:这是出现在意识中的唯一的结果,也即物体本身的观念。     

 将知觉融合成单一物体的观念,就其必要性而言,部分在于这些知觉的无限数量。不断向我们的双目呈现的是与三维物体相应的并补充三维物体的分区的投影。我们总是根据通过我们双目获得的关于外部世界的不同观点来感知这些物体。但是,将两部分的观念联结起来的动机只是事情的一半。在心理努力中还可以找到另一种更强烈的影响支配着一切知觉过程--努力获得同时发生的观念和观念要素的永久性联合。我们已经发现,在刚才谈到的分区和三维的知觉过程中,这种努力运作着。毫无疑问,两种视觉映像的融合是一种心理联合活动的结果。但是,我们仍然需要更加精确地确定这种联合是如何发生的。     

当讨论单眼知觉的形成时,我们发现运动感觉(sensations of movement)提供了对视野中一些分离点的空间距离的测量。与此相似的是,在双目的深度观念中,也是运动感觉为我们提供了对空间距离的基本测量。如果共同视野包含了单一的亮点(bright point),那么支配着视网膜上黄斑(yellow spot)的眼动关系的反射机制便导致了双眼对该单一亮点的凝视。该亮点的映像投射于黄斑,也即视觉最清楚的地方;它是视轴发生交叉的地点。如果在共同视野中出现其他亮点,这些亮点便依次地被感知,其顺序按照这些亮点刺激眼睛趋向于运动的强度而定。由此,产生了对视野中出现的与众不同的点或界线的连续凝视。但是,当双目以这种方式一个点接一个点地区分出一个物体时,必然会在各种情形之间立即产生重要的差异。如果目光扫视过的那些点存在于一个平面上,那么不再被凝视的那些点的映像--也就是说那些点的映像没有落入黄斑,而是落入视网膜的侧面部分--仍然会影响双目中近似于重合位置(coincident Position)的一些视网膜的点。这种位置的重合也提供了有赖于印象位置的特定感觉色彩的某种相似性。另一方面,如果连续凝视的点位于离开眼睛的不同距离,那么不再被凝视的点的映像就不会落入重合位置和两眼视网膜中相似感觉特征的点上。随着把这些点分离开来的第三维度的距离越大,这种分叉(divergence)现象也会越大。在这种情形里,两种视觉映像的联合必然会存在基本的差异;而且,与表面知觉(perceptions of Surface)和深度知觉相对应的两个系列的实际经验将会清楚地彼此区分开来。 三

 

 

      然而,我们必须要问,上面讲的这种区分怎样才能形成与分区的物体观念相对的三维物体的特定观念呢?在这一点上,不同的观念仍然是可以考虑的。许多权威人士说,只有落入重合的视网膜点上的映像才可以看作是单一的;所有其他的映像都可以看作是双重的。因此,我们可以根据存在还是不存在双重映像(double images)来确证存在还是不存在第三维度。把这些东西分离开来的距离--也就是它们偏离重合的视网膜位置的大小--使得我们直接推理第三维度中延伸的大小。因此,深度知觉仅仅存在于对双重映像的忽略之中;深度观念越是清晰地产生,越是要忽略这种双重映像,以便达到对单一物体的知觉。     

 然而,这种观点经不起实验的检验。如果把图31引入立体视镜中来,那么左眼接收映像A,右眼接收映像B。线段1和线段2落入视网膜的相应部位,线段1和3则落入不同的部位。结果,两根粗线1和3融合成一个单一的观念,从粗线1和3的融合中产生的线段提供了清晰的深度知觉,而细线2在纸的平面上与它发生交叉;也就是说,我们的视觉已经将落入两眼视网膜不同部位的两根线段合而为一,而落入相应部位的两根线段被分别地感知。由此必然引申出这样的观点,即深度观念无法产生于对双重映像的感知和继后的忽略。如果情况真是如此,那么投影于一系列相应点上的映像1和2,便不可能作为双重映像而分别出现。此外,这个实验还证明了视觉的形成是一种基于两种视知觉联合的观念活动,它不仅由视网膜映像的位置所决定,而且还由这些映像所具有的其他特性所决定。这两根粗线首先把自身强加于知觉,并且当双目的映像被比较时它们又可以单独归属于单一的物体;而物体本身必须在空间的第三维度中延伸到映像所占据的位置。 

 

      因此,深度观念并不是由视觉的共同活动中忽略分离的知觉或集中弱化分离的知觉而产生的,恰恰相反,深度观念是通过清楚地理解这些分离的知觉及其继后的结合而产生的--这种初级的联合进一步与其他类似的观念相联合。两个视网膜映像的差异并不意味着作为无价值的错误东西而不予考虑。恰恰相反,它们为我们提供了对外部物体空间质量的不同寻常的确切测量。而且,下面的推论将是不可避免的,即如果我们通过视网膜映像的差异而感知到这些空间的特性,那么这些机网膜映像本身就必须在知觉中与它们独特的空间差异一起被提供。     

 但是,这些机网膜映像的差异(它们的比较为我们提供了深度观念)被感知并被精心制作成观念的方式可能还存在一些怀疑。我们必须从这样的一个事实出发,即眼球的运动感觉(它们向我们通报了分区性视野的空间关系)也提供了--至少在最初--对第三维度中距离的测量。于是,深度观念由运动产生的假设看来有了可能。我们已经讨论了眼动(eye-movement)在估计距离方面的意义。如果我们用双目凝视一个物体,那么物体离我们距离的增加或减少可以通过眼动的辐合(convergence)或发散(divergence)而十分鲜明地被感知到,这种辐合或发散的运动是由双目进行的,目的是保持该物体能被恒定地凝视。我们通过运动一感觉意识到这些运动,并且通过运动一感觉,我们对物体的趋近或移远进行测量。如果一个空间延伸的物体放在我们面前,那么它只向我们同时展示当一个物体运动时相继感知到的东西。与此同时,尽管三维物体作为整体放在我们面前,我们在单一瞬间只能清楚地感知该物体的某个部分。在这种情形里,我们还通过辐合和发散的眼动逐步地由较近点移向较远点,或者从较远点移向较近点。用此方式,我们感知了物体中较近和较远的东西,正如我们观察运动中一个单一的点的位置变化那样。   

毋庸置疑,深度观念原先就是以这样的方式通过一系列感觉和知觉而产生的。但是,深度观念是否继续以同样方式产生,由双目逐渐获得的每一个单一观念是否继续由一系列相继的活动来形成,这便是一个不同的问题了。我们已经在研究平面的知觉中讨论过类似的问题。在这个领域,也是运动起着重要的作用。但是,我们看到,运动并非在每一种单一的知觉中继续起作用,静止的眼睛本身也能见到空间的事物,并对空间的延伸具有相当精确的测量。而且,我们还发现,正是在视觉中存在这种部位色彩(local colouring),从而使眼睛省却了这些持续的运动。这些部位的信号(local signs)是永久的属性,一俟这些属性与运动感觉的关系被发现,那就足以把感觉带入延伸的形式。

 

 

      因此,深度观念(在双目视觉中产生,以便使我们对视觉空间的简单理解变得完整),也可以在眼睛完全静止的时候产生。看来,深度观念通常在眼睛受到光的印象(impression of light)作用时瞬间出现,所以它几乎没有什么时间从若干由运动分离的相继知觉中形成深度观念。这种现象可以由下述实验作精彩的和结论性的说明:如果允许一名观察者在黑暗中借一台立体视镜进行窥视,而立体视镜中的图像突然由电火花照亮。电火花的持续时间如此之短,以至于在电火花发生期间不可能有任何眼动。但是,如果图像十分简单的话,由电火花照亮后也会立即产生第三维度中清晰的延伸观念。 

由此看来,深度观念可以在极短的时间里产生,而且在引起深度观念方面肯定毋须任何系列的运动。也就是说,在这一事例中,一定有某种东西,使静止的眼睛具有这样的视觉特征,通过这种东西,视觉可以摆脱原先强加于它的一些条件。这里所谓的某种东西,除了下述的东西以外,不可能是别的东西了,那就是我们的平面视觉也在某种程度上摆脱了运动的协作,而这种运动的协作原先是必不可少的。这里,我们再次提及部位的感觉特征(local character of sensaions),这些特征的作用是决定它们在所属的视网膜上的安排,发出信号,以便使大脑构筑每一种特定的视网膜映像的空间延伸。大脑根据它在这些映像中发现的差异,测量第三空间维度中物体的延伸。如同在分区性视野中,重合的映像落入视网膜的一些部分,赋予一种实际上共同的感觉特征,为我们提供了在单一平面上物体延伸的标志一样,对那些不具相似特征的感觉来说,它们所在的视网膜部分的激发,也在第三维度中充当了延伸的一种信号。

正如你们知道的那样,我们对于空间距离(它与感觉之间的某种差异相对应)的测量,原先是按照运动来进行的。但是,一俟获得了这种测量以后,这两种感觉系列(运动感觉和部位感觉性质)的稳定联合便有可能在某些情况下使第一个系列(即运动感觉系列)消失,而对空间距离的测量仍然没有受到影响。与此同时,观察表明,两种系列的联结(即运动感觉和部位感觉性质的联结)不可能永远受到干扰而不造成空间视觉的扰乱,这种扰乱只能由一种新的系列的联结一步一步地逐渐予以消除。因此,如果眼睛在特定的空间知觉中摆脱了运动的决定性影响,那么这种摆脱仍然不是什么绝对的事情。但是,不论什么时候,由运动进行重新控制将被发现是相当必要的。只有运用这样的方式,两种感觉系列的牢固联合(这种牢固联合是由位于感觉器官中的一些条件坚持不懈的运作才使两种感觉系列彼此进入这种联结之中)方能保持在不受干扰的完整性(integrity)之中。

  • 暂无资料
  • 暂无资料
  • 暂无资料
  • 暂无资料
  • 暂无资料