第十四章 知觉心理学家 -2
观察深度
在自然中,不像在实验室里,所有的外形或者移动都不可能脱离三维性质而存在。为了理解日常生活中的外形及移动知觉,理解深度知觉是至关重要的。心理学家一向认为这是有关知觉的中心问题。他们有关深度知觉的所有文献来源将塞满一本书的空间。
基本的问题一向是既明显又简单:当我们的信息来源,即视网膜上的图象基本上是两维的时候,我们是如何看到三维世界的?我们看到的为什么不是一个平面的世界,比如在一张彩照里,每个物体的距离和三维特质只能通过其大小、视点、阴影和其它提示来暗示呢?
事实上,这些提示就是一组理论所提供的答案。这些理论的形式各种各样,可是,它们都认为深度知觉不是自动和天生的。有些理论说,它是一些经验带来的结果,它使我们将深度与提示联系起来;另外一些理论认为,这是学习得来的心理过程,我们可以通过这个过程从提示当中推出深度来。
说深度知觉是我们将提示与深度经验联系起来的产物,这种观点在洛克和贝克莱的时候就开始了。从他们那个时代到目前,联想-行为主义传统中的心理学家们一直都认为,我们都在有意无意地把视网膜二维图象的提示与物体离开我们有多远的经验联系起来,这样就产生了一些提示。
另有一种观点是,我们能够感知深度是一种对所看到的事物进行逻辑推理的结果。它首先是由J·S·密尔于1843年提出来的,他提到知觉的时候说,我们观察到的东西有十分之一是观察,十分之九是推理。在这个世纪的后期,亥姆霍兹更详细地提出,我们是根据视网膜上的二维图象无意识地推测出三维的现实。从那时起到现在,一系列认知方向上的心理学家都认为,知觉,包括深度知觉,部分地,或者在很大程度上是高级心理功能的产品——“有点像思想的过程”欧文·罗克这样说——在这些过程当中,从提示中进行推理只是其中一个。
不管人们喜欢哪一种说法,对深度的提示在日常生活中是极为熟悉的,而它们在知觉中的作用已经通过好几百种实验所显示。这里是一些主要的线索和一些具有代表性的实验:
——明显的大小:一个物体越远,它看上去就越小,可是,如果我们已经知道它有多大——比如一个人——我们会从它显示的大小上推断距离,哪怕它是在一个毫无特点的平面上,我们得不到任何提示也是如此。在1951年进行的一项实验中,一位研究者制作了一些扑克牌,从正常牌大小的一半到一倍不等,然后在实验室条件下请受试者看这些牌,因此没有任何有关距离的提示。受试者认为一倍大的扑克牌在离他们近些的地方,而只有一半大小的牌离他们远些。所有的牌实际上是在同样一个距离内。
——介入:当一个物体被另一物体部分地挡住时,我们会意识到,被挡住的物体会比挡住东西的物体远些。我们远看城市风景时,会很容易地感觉到一个遥远的高层建筑的距离,因为较低层的一些建筑挡住了高层建筑下面的楼层;另一方面,在海上,一个浮动物体的距离是很难判断的。
——视点:从观看者这面向外走的平行线,比如铁轨或者墙壁边角、地板和走道,是会与距离聚合起来的。我们受到这样一些提示的影响有多大,可以从下面这个图案中看出来。
视点坡度就是不可能把这些圆柱看作一样大,尽管它们实际是一样大的。——物体表面的质地——有草的一片地方,一条水泥人行道-是不变的,可是,质地越来越细的纹路在远处看来就是一条重要的线索,可以看出任何东西在表面上的距离。
——远处的建筑物或者山岗看上去很平淡,比近处的物体要模糊一些,这是因为中间隔着大量的气层。
——视差:在我们移动时物体与彼此之间不断变化的关系——它是一个重要的深度信息,特别是对近处的物体相对于远处的物体观察时。
——聚合与适应:当我们看一些离我们很近的物体时,眼睛会向内产生一个角度,每个晶状体旁边的肌肉都未能使它集中注意力。当我们看远处的物体时,眼睛是平行的,晶状体会处于放松的状态。共生的内脏感觉是一些重要的线索,可以告诉我们10英尺及以内的物体的距离。
——双眼差异:当我们看一个相对很近的物体时,它的图象会落在每只眼睛的视觉中心——视网膜的中心上面,而同样远的一些物体的图象会落在两个视网膜相对应的地方。不管物体的远近,其图象却会落在视网膜不同的地方,如下图所示:
两个视网膜图象之间的差异通过大脑进行解释,以指明哪个物体离我们远些。双眼差异在从800-1900英尺之间的特写中效果最明显。有些知觉理论认为这是对深度最为重要的提示。
前述所有深度提示都可以用内在机制或者学习到的行为加以解释。可是,深度知觉的天生要素,却是由另外一些更有说服力的证据来证明的。
一系列有历史意义的实验指明,深度知觉是本能性的,这些实验是50年代和60年代早期在康奈尔大学由艾林娜·吉布森进行的,其对可发音和不可发音词汇的高度阅读进行的工作,是我们前面提到过的,她是与同事里查德·沃尔克一起做这些实验的。吉布森终身害怕崖壁,而沃尔克在二战期间曾让受过训练的军队从高台上往下跳,他们合作起来创立了一种“视觉悬崖”,以确立老鼠是学习得来的深度知觉还是天生就有这着本领的。视觉悬崖是一大块玻璃,其下面的一半贴着瓦楞形的墙纸,另一半也贴着墙纸,但在几英尺以下的地方。问题在于,没有深度经验的动物——即从没有在任何形式的高度上往下跳过的东西-会自动地避开看上去像是要往下跳的东西。
研究者们在黑暗中养鸡、鼠和其它一些动物,不让它们产生任何深度经验,然后放在一块板上,这块板在玻璃上从有阴影的一边跨过,到另一个看上去更深的地方。结果极富戏剧性。动物尽管从没有经历过深度,但总会避开较深的一边,并在板上退后,退到有阴影的一边。然后,吉布森和沃尔克对人类婴儿加以实验。如吉布森不久前回忆的:
我们不能在黑暗中哺育婴儿,只好等他们能够自己移动时,才把他们对边缘的躲避当作我们的深度区别指标。可是,只会爬行的婴儿的确会避开“很深的”一边。他们可能在学会爬行之前就已经学习到了某些东西,可是,不管那是什么东西,他不会从外部得到很大的强化,因为父母从没有报告说婴儿曾经从一个什么样的高度上摔下来过。
每个婴儿的母亲会站在这个装置的左边或者右边,并向孩子召呼。在几乎所有的情形中,婴儿在阴影里面时会一步步地向母亲爬,可是,在27个婴儿中,只有3个敢向很深的那一边爬。
(最近由其他一些人做的实验却倾向于削弱吉布森与沃克结论,这些实验表明,人类婴儿对高度的害怕是后天得来的——不是通过摔下来的体验,而是通过总体意义上的移动经验得来的。)
认为深度知觉是内置入神经系统的极有说服力的证据,是1960年从一个不太可能的来源,美国电话电报公司的贝尔实验室和一位同样不太可能的研究员,一位当电视信号发射专家的年轻电气工程师。贝拉·朱莱茨出生在匈牙利,并在那里接受教育,1956年的革命失败后来到美国,并被新译西默雷山的贝尔实验室录用,主要解决压缩电视线号使用的频道宽度问题。可是,朱莱茨被一些更有趣的问题吸引住了,从1959年开始,在贝尔实验室的默许下,决定专攻人类视觉问题。虽然他从来没有得过心理学学位,可是,他很快就成了一位获得许多殊荣的知觉心理学家,是贝尔实验室视觉知觉研究处和麦克阿瑟基金会的主任,1989年还当了鲁杰斯大学视觉研究实验室的负责人。
朱莱茨因为想到了一个主意而使他在心理学界立即出名,这时候,他才刚刚开始视觉研究。他在阅读有关实体深度知觉的书籍时惊讶地发现,实体视觉的整体接受是大脑将一些提示与每只眼睛的图象里的外形和深度进行比较的结果。这被认为形成了图象和深度知觉的重合。朱莱茨以前在匈牙利曾当过雷达工程师,他感觉到,这明显是错误的:
毕竟,为了揭开空中侦察的掩饰,人们会通过一种实体镜来观察空中图象(从两个稍有不同的位置),而被掩饰起来的目标会以极鲜明的深度跳出来。当然,在现实生活中,并不存在理想的掩饰物,在经过实体镜的观察以后,人们可以用一只眼检测到有可能从其背景中将一个目标区分出来的微弱的提示。因此,我利用当时刚刚运到贝尔实验室来的最大计算机,即IBM704,来模拟理想的掩饰实体图象。
这是由随机利用黑白点制造的图象构成的,如下面这两个图案:
如果单独看其中一个图案,这两个图案中没有深度提示。可是,尽管它们大部分是相同的,可是,中心部分有一个小区已经通过计算机稍稍向一边偏了一点,因此,当人们用一只眼睛看每个图象而这些图案重合在一起时,这个小区会产生一种双眼视差,并看上去会从背景中浮起来。(要看看这个惊人的效果,可以用一块4×4英寸的纸板或者一张纸竖直放在面前,并与本页垂直,这样的话,每只眼睛就只看其中一幅图案。看着图案的一个角,过一会儿后,两个图案会向彼此移动并重合在一起。这时候,中心方块会显得从纸页上腾起约一英寸的样子。)
这种随机点构成的立视图远远不止是逗人好玩的把戏。它证明,实体视觉并不依靠每个视网膜上的提示形成三维特质的体验,而且,反过来,大脑会把无意义的图象重合起来,从而显示出三维特质隐藏起来的提示。这不是认知过程,不是学习如何解释深度提示的问题,而是天生的神经生理过程,它发生在视觉皮层某个特别的层面里。组织严密的一些相互作用细胞就在这里发生图案中点的相关作用,得出重合后的三维效果知觉。(实体效果并不是我们获取深度知觉的惟一途径。朱莱茨的工作并不排除其它一些办法,包括那些涉及学习的方法。)
朱莱茨很自豪地看到,他的发现导致胡贝尔和威塞尔及其他人把注意力从外形知觉转向了对双眼视差的调查上了,但他很谦虚地说:
我从来没有把自己将随机点立视图引入心理学的作用看成重大的智力成就,尽管它的许多成果对大脑研究确有裨益。这只是一种幸运的巧合,两种文化之间的碰撞,在一个会说两种语言的人的头脑中两种语言之间的联想(心理学家和工程师的语言)。
有关深度知觉,还有另一种现代理论,既不是专门性的神经方面的,也不是专门性的认知性的。并不是说其提议者机智地将两者合并起来了,反过来,他实际上把神经理论和认知理论当作不需要的东西弃而不用,并且认为它们是以错误的假设为基础的。
只有一个胆识过人的怪杰,才有可能把一个世纪以来对深度知觉的研究全盘抛弃,并宣布自己已经找到一种全新的正确办法。只有一个真正的不服从传统的人,才有可能确切地说,我们感知深度既不是通过神经检测器,也不是利用提示进行推理,而是“直接”和自动地产生知觉的。只有一个性急的人才会提出一种激进的认识论,他认为光的物理特性就是,来到眼睛里面的东西就是深度的准确和实际的体验,我们不需要解释看到的东西,因为我们看到的就是实际的东西。
这样一个人就是已经过世的詹姆斯·J·吉布森(1904-1980),他的崇拜者认为他是“20世纪视知觉方面最为重要的学者”和“知觉心理学世界里最有创见的理论家”,可是,他的理论被大部分知觉专家看作是“极为难以置信的”(一位评论者甚至认为他的理论太过“愚蠢”,根本就不值得讨论),也没有行家倡导他的理论。
吉布森在1950年和1980之间形成他激进的知觉概念时,对他的事业并没有多大的帮助,他对总体的主流心理学中现存的知觉理论更是嗤之以鼻。他典型的评论是:“心理学,或者至少是美国心理学,是一种次等的学科……主要的原因是,它对自己的主题并没有敬畏感”,“心理学[是]要寻找错误问题的答案;选择来研究的问题都是对于研究很方便的,而不是相关的问题”。可是,尽管他的观点听上去怒气冲冲,而且还有严重的听力问题,他一向总还是很平和的,很迷人,非常友善,跟他接触过的几乎所有人都喜欢他,一位热情的编年史学者认为他“非常迷人、有活力,很可爱”。
吉布森出生在俄亥俄省的一座河边小城里,并在中西部的各处长大,其父是一位铁路寻视员。这使他有很多机会搭乘火车,并在铁路上体验到很多后来成为他的视知觉理论核心元素的东西。如他在一份简短的自传中所言:“8岁的时候,我从铁路上知道了世界看上去是一个什么样子,站在列车后部看世界时,它看上去是向内流动的,而从火车头看去,它又是向外扩大的。”
吉布森去了普林斯顿大学,可是他觉得这里的一些人不如人意,而情愿去接近他叫做“神经病”的一些人。有一阵子,他在哲学和社交活动(他一头卷发,方脸,长相极帅,很可做一个领袖人物)之间来回不定,可到了高年级以后,他选了一门心理学,立即就喜欢这门学科了。他在普林斯顿读心理学研究生时,受到了行为主义心理学的影响。然而,1928年,他接受了去斯密斯学院当教师的委任,在那里遇到科特·科夫卡,接着,虽然他没有成为格式塔学者,却受到了格式塔心理学中有关组织和结构概念极大的影响。
一些年来,吉布森对社会心理学和相对传统一些的知觉研究都有兴趣。接着,在二战期间,他被“陆军航空人员航空心理学计划”请去开发深度知觉测试,以确定谁具有飞行,特别是成功起飞和降落必备的视觉敏感度。
也许因为吉布森早期在火车上的一些经历,他认为传统的深度知觉提示,包括阴影和视点,都没有什么价值。在他看来,这些都是以油画和客厅里的立体照相机,而不是现实中的三维特质,以静态的图象而不是以移动为基础的。对他显得更有用得多,更现实得多的,是两种提示:纹理阶度,就像飞行员在接近地面时迈出最后一脚时看到的跑道上不规则变动的粗糙;还有活动视点,或者是当一个人在环境中移动时物体之间不断变化的关系的流动,包括飞行员在起飞和降落时看到的所有东西。这些提示很快就被接受了,到今天仍然是深度知觉当中以提示为基础的理论中的一部分。
吉布森的航空人员工作里面包含有他日后观点的精华部分。深度知觉中最为关键的机制(按照吉布森的说法,在所有的知觉中)不是视网膜图象,尽管它有许多提示,而在于物体之间相对关系不断变化的流动,及其处于感知者移动的环境之中的表面。
这一概念后来慢慢主宰了吉布森在50年代和60年代的思想,当时,他在康奈尔大学做了相当数量的研究,并对其纹理阶度信念进行了测试。在有些测试中,他把一些发散性的奶瓶放在观察者和有纹路的表面;在其它一些实验中,他使观察者的眼睛发生肿胀,以避开对纹理过份集中。在还有一些实验中,他把乒乓球剖成两半,做成护目镜,因此,他的受试者看到的东西就像青蛙一样,没有表面,也没有体积。从类似的这些实验中,再加上他对航空人员的研究加以仔细考虑后,吉布森慢慢慢抛弃了纹理阶度,把观察者通过环境的移动强调为深度知觉的关键。不管移动有多大或者多小,它都会给视觉排列带来变化——从环境来到眼睛里面的光线有结构的模式——比如在下幅图中:
视觉排列富含从任何一个角度看到的信息,它会随着观察者的移动而变得无限丰富。哪怕是头部最小的变化都会改变这种排列,它会使看见的物体的样子发生变化,得出这种或者那种光学流动。吉布森慢慢相信,有足够的,远远超出足够的信息在视觉排列里面,还有流动,可以直接传递深度和距离,根本不需要心理计算或者根据提示推算。
下面就是吉布森在他总括性的“直接知觉”、“生态学”理论中解释的深度知觉。可惜的是,吉布森这个局外人和怪杰,这个按他的一位心理学家同事的说法是“极端固执和毫不让步的”人决意非得把洗澡水和婴儿一同泼出去。因为,有可能承认神经和认知深度知觉观正确地解释了一个现象不同的方面的问题,而吉本森的观点是对这两者的补充。可是,对吉布森·J·詹姆斯来说,这就是不可能。
对视觉的三种不同看法
“视知觉,”贝拉·朱莱茨最近说,“所处的状态与物理学在伽俐略之前,或者生物化学在沃森和克里克发现DNA双螺旋之前一样。”他可能对自己有些苛刻,不过,两种主要的方法——如果我们把吉布森的理论与其它的理论并列在一起的话,那就有三种——都只能解释这些现象的某些方面,还没有一种综合性的视知觉理论。这可能意味着,某种大型的组织性概念尚没有发现出来,或者说,视知觉是如此复杂,没有一种理论可以解释它所有的方面,不同的方法解释各个不同的复杂问题。
我们已经看到过一些不同的方法。在这里,我们做一个收尾的工作,把他们对视知觉的解释在总体上做一个全面的勾勒。
神经元理论:这种方法回答的问题,是19世纪的生理学家们一直很着迷的:感觉神经虽然在结构上都是一样的,它是怎样把不同的感觉传递到大脑里面去的呢?
这个以详尽的细节作出的答案是,神经脉冲本身并没有什么差别;反过来,对某些刺激有反应的接受器把它们的信号分开发送到纹状体,即视皮层的主要区域。胡贝尔和他目前的同事玛格丽特·利文斯通(威塞尔与胡贝尔合作20年后另分一支了,他现在是洛克菲勒大学的校长)最近显示,由外形、移动、深度和色彩生成的脉冲经由不同的平行通道到达皮层,并稍后在那里形成一个整体。(色彩是一个研究得很多的课题,它只是本书焦点外围的部分,因此加以忽略。)
主视觉皮层只覆盖约15平方厘米的面积,但其内部的建筑却是极为复杂的。好几十年来的神经生理学家们一直在探索这个结构及其内部的线路原理。他们得知,进入里面来的信息首先进入“简单”细胞,在这里被谐调起来,以对具体的刺激作出反应。这些细胞把他们的脉冲通过极复杂的线路原理送入“复杂”细胞,这些复杂的线路原理在很大程度上是基因决定的。复杂细胞开始整合单个的脉冲,并把来自两眼的信息混合起来。结果是,视网膜图象被以“地图”形式作为复杂神经元的集体激发而送入视皮层,可是,这些激发的模式并不像视网膜上的图象,也不像眼睛之外的场景。按胡贝尔和威塞尔的话说:
视觉场景在投射到视皮层里面去的时候,实际上什么样子呢?假设一个动物盯着某个点,而视野中惟一的物体就是在这条直线稍上和偏左的地方,动物的目光就盯着这个点。如果每一活跃的细胞都会被点燃,再如果一个人可以站在皮层之上然后朝下看,这个图案会是什么样的呢?为了使这个问题更有趣,假设这个图案只由一只眼看着……这个图案却原来不是一条直线,而只是一组有规则地分布开的串。
换句话说,它不是一个图象,而是一个编了码的图象表达,这有点像录音带上磁场的图案并不是声音,而是一种编了码的声音表达。然而,这种表达的确还不是知觉;如胡贝尔和威塞尔所言:“主视觉皮层绝对不是神经传导的终结。它只是一个阶段,比较起它所处理的信息的抽象程度来说,它兴许只是一个早期的阶段。”
部分集合和整合起来的信息从纹状区域发送到视皮层的另一个区域,再到达超出它之外的更高的大脑皮层区域。在这里,信息最终被思维看见,并被认出来属于某种熟悉或者以前没有看见过的东西。这是如何发生的,到目前为止还没有弄清楚,大部分神经生理学家都这么看。可是,有少数人却大胆地猜想,在大脑较高级的水平上,有一些包含以前看见过的、以突触连接或者分子沉积形式表现出来的物体的“痕迹”,而这些细胞只有在一个输入的信息符合痕迹时才会有所反应。这种对能配合的一方作出的反应是一种意识(“我见过这张脸”);非配合不会引起反应,它也是一种意识(“我没有见过这张脸”。)研究者们半开玩笑,半是严肃地把这些假设性的视觉系统神经元称作“祖母”细胞,因为其中的一些只在看见自己祖母编了码的本身时才会有所反应,而对其它的任何信号皆置之不理。
除开这些想象的东西不说,神经理论告诉了我们很多有关视知觉在微观水平上的工作机制,但没有宏观的理论;说了很多有关视觉机制的话,但没有谈到其拥有者和操作者,谈了很多有关神经元反应的东西,但没有说到知觉经验。如一位认知理论家所说的:“只研究神经元来理解知觉,这就像只靠研究羽毛来理解鸟的飞行一样。”
认知理论:这种方法主要处理在像外形一致、特征辨认、外形辨认、从提示中得来的深度知觉和当许多信息丢失后辨认人物等的知觉现象中运作着的心理过程。
得出这些结果的心理过程,是由几十亿的神经现象构成的,可是,认知理论家们认为,需要宏观理论,而不是微观理论来解释这些过程。一位研究一个波浪如何改变形状并在接近海滩时粉碎的物理学家,不会从数不胜数的水分子的相互作用中得出波动机械学的法则,就算利用巨型计算机也得不出一个结果来。这些法则表达的是集体效应,它们存在于一个完全不同的组织里。一个人与我们谈话时发出的声音是由大气中的分子的震动构成的,可是,这些话的意义绝不可能以这些分子形式表达出来。
视知觉的心理过程亦是如此。它们是神经现象集体的组织效应,是由心理法则,而不是神经生理学的法则表达出来的。我们已经看到过这方面的证据,但是,有一个特别有趣的例子是很值得讨论的。当我们从记忆中调出一个图象并在思维的眼中看它时,会发生什么样的事情,并在什么样的水平上发生呢?由认知理论家们进行的一些实验显示,这只能在高级认知理论上进行解释。最为流畅和表现力最强的的实验,是由斯坦福大学的罗杰·谢泼德进行的“心理旋转”实验。谢泼德请受试者说出下列三组中的物体是否是一样的:
大多数人在研究过这些图案后会认出,A里面的物体与B里面的物体是一样的。C里面的物体不是。当问及他们如何得出结论时,他们说,这些东西在他们的头脑里面转动,就好像在现实世界里转动真实的东西一样。谢泼德通过另一项实验显示出这个过程是如何反应了真实的转动的。在这项实验中,看东西的人从一个有角差的角度看见一个既定的形状。比如,下面这套实验显示出一系列位置上的单个形状:
给受试者看这些图案时,他们辨认出这些东西彼此一样所需的时间与这些图案位置的角差成正比。也就是说,一个图案与另一个进行比较时需要转动的角度越大,辨认所需要的时间就越长。
这只是许多知觉现象中的一个例子,它们涉及更高的心理过程,必须以外部世界的内化符号进行操作。最近几年,一系列知觉研究者在尝试形成一个综合性的认知理论,以说明这些过程是什么样的,它们是怎样产生这些知觉的。
他们的理论有两种方法。一种是利用从计算机科学的分支——人工智能中得来的概念及过程。人工智能基本的假定是,人类心理活动可以通过一步一步的计算机程序加以摹仿,也按这同一种步骤一步一步地发生。人工智能专家们一方面是想让计算机辨认出他们正在寻找的东西,一方面是想获取对人类知觉更好的理解,它们编写了好多外形辨认的程序。为了获取基本的外形辨认元素——比如辨认三角形、方形和其它规则的多边形——一种程序也许会按一系列的假如——那么步骤来进行。如果有一条直线,那么,它会跟着直线下去,并测量它,直到末端;如果另有一条线从这里继续下去,那么它会把这个点叫做一个角,并测量这个角,经由这个角而改变方向;如果这另一条线是一条直线,那它就会跟踪它,直到……等等,直到边和角的数字已经被数过,并与一个多边形和其特征的对比而配对。
赞同人工智能方法对视知觉有用的主要说法是,大脑里面没有投射器或者屏幕,也没有想象的小侏儒在里面看事物;因此,思维一定不是在处理图象,而是在处理编了码的数据,它一步一步地处理,而计算机程序正是这样工作的。
反对人工智能方法的主要观点是,与人类的程序比较起来,还没有任何机器视觉程序可以与之相匹敌的,还没有辨认平面形状,还不说三维图象的能力,也没有哪一种程序可以感知周围世界里的三维分布,也不能理解它是不是在环境里面,也不能辨认出岩石、椅子、沙发、水、面包或者任何它所看见的东西可能的物理特性。如乌尔里克·赖塞尔所总结的:
在机器视觉设计里面碰到的许多困难,都可以归结到一个简单的来源中:设计者们进行的工作缺乏有效的理论。他们大都以为视知觉是辨认特别刺激模式的问题。如果果真全都如此,我们应该早就能够生产出有视力的计算机了。没有形成以这些理论为基础的模型,失败的原因都可以作为一个证据,证明这些理论本身不行,因此也可以证明需要另一种方法。
关于认知知觉过程如何工作的另一个思想流派,依赖于对人类思想而不是对机器进行的思想摹仿进行的实验室研究。这个观点的起源可以远到亥姆霍兹时代,当时的传统看法是,知觉是从不完整的信息,包括另一类有意识的思想过程进行无意识推理的结果。其最显著的倡导者是我们前面提到过的、加利福尼亚大学的欧文·罗克。他1983年的《知觉逻辑》一书在1991年的“心理学年报”中被描述为“是对在观察者一方好像需要智力活动才能得到的知觉效果最为全面和实验上最可行的解释”。
尽管罗克是一位杰出的感觉心理学家,可是,他在其早年的学生生涯中远非如此。事实上,在一个知识分子家庭里,他是一头黑羊。可是,在二战期间,他那支部队受到敌机轰炸,他感觉到自己会被炸死,“我对自己发誓说,如果能够活下来,我会在有生之年做比以前更多的事情”。战后,他成了顶尖大学生。他在物理学方面开始其研究生学院的生活,可当他意识到,在心理学这门年轻的研究领域里对知识作出更大贡献的机会要大得多以后,他就转向了心理学。
在社会研究新学院里,罗克受到了格式塔学派很大的影响,他自己也成了其中一个热情的研究者。格式塔心理学中的一些基本的组织和关系思维法则仍然是他的理论中的一个部分。可是,这些法则描述基本的自动过程,而罗克慢慢相信,许多知觉现象只有通过像一种思想一样的心理过程才能得到解释。
他在1957年进行的一项实验中开始产生这个想法,如上所述,他把一个方框倾斜一下,让它看上去像钻石形,然后再证观察者倾斜过来。由于观察者仍然认为这个方框是钻石形的,罗克推出,观察者一定是在利用视觉和内脏提示来解释看到的东西。罗克花了许多年的时间设计和进行其它的实验以检测一个假设,即,知觉经常需要比视皮层更高水平的一些过程。这些研究最终引导他得出目前的论题,即“知觉是智力的活动,因为它基于类似构成思想的那些操作”。
而罗克说,的确,知觉也许就是思想之所以诞生的原因;也许就是原初有机体低水平的感觉过程与更复杂的生命形式高水平的认知过程之间的进化连接。他认为,如果眼睛看到的东西是一种意义模糊和对现实易于变形的表达,有些机制就得发生进化,以得出对现实可靠和忠实的了解。按他的话说,“智力操作也许就是为了服务于知觉而进化出来的”。
这并不是说,所有的知觉都是类似于思想的。罗克特别引用了瀑布错觉,作为在低水平的神经形式上可以解释的例子。可是,有关运动知觉和其它形式的知觉的大部分事实对他都好像需要高水平的过程。无意识的推论,比如我们利用纹理阶度提示来感觉距离,只是其中的一种。对这种解释的结果的描述是另外一种。在由波林绘制的含义模糊的老巫婆与少妇图案中,人们看到的不仅仅是简单辨认一个图像的结果,而是对自己解释一个特别的曲线是什么样子的结果:像一只鼻子,或像脸。许多物体被知觉出来的形式并非立即可以辨认出来的;辨认事物究竟是什么东西是通过这样一个过程得来的。
知觉还经常需要这种或那种问题求解。人们很少认为知觉是问题求解,可罗克已经掌握了大量的证据——很多是从别人早期的研究中得来的,有些是从他自己的原创实验中得来的——可以显示,在很多情况下,我们寻找一个假说来解释我们看到的东西,把这种假设与别的可能性进行比较,然后选择好像能够解决使我们看到的东西产生意义这个问题的那一个。所有这些通常都发生在几分之一秒的时间内。
一个例子:在一个自亥姆霍兹时代以来就知道的一项实验室现象中,如果一条像波浪的曲线横向通过一个细孔,如下图所示;
大多数观察者首先看到小的元素在上下移动,可是,过一会儿后,其中一些人会突然看到这条曲线以直角在孔的前后移动。是什么东西产生了这些发生了变化的正确的知觉的呢?罗克发现,他们使用的一条提示是线条在通过小孔时不断变化的曲率;另一个是曲线的末尾,如果它能够为人们所看到的话。这些提示给思维提示了另一种假设——一条曲线平行通过小孔,而不是一个小元素在上下移动。这个假设好得多,思维很快就接受了,并认为这条线真的就是这个样子的。
罗克是这样总结他的理论的:
在理论水平上,至少按照提供在这里的一套理论来说,知觉和思想包含着推理。在有些情况下,总括或者规则是通过归纳在知觉中形成的。这些规则接着就被演绎加以利用,作为推出结论的前提。某些情形下的知觉可以概括为创造性的问题求解的结果,因为它也是在寻找一个基础(或者内部的解)从而得出一个具体的解释。知觉包含着决定,正如思想一样。最后形成知觉经验的操作与概括思维的东西是同一类型。
直接或生态知觉理论:吉布森及其追随者的直接或生态知觉理论不仅仅试图解释深度知觉,如我们前面已经说过的一样,而且要解决总体的视知觉问题。吉布森的理论,即观察者通过环境的移动会产生一个连续变化的视觉排列,不仅仅是他的深度知觉解释的中心,而且也是他对形式、大小、距离和运动知觉的中心。
吉布森于1979年在《视知觉的生态学方法》一书中阐述了他的理论,他的阐述深奥难解、穷根究底,很难读下去,部分原因是因为他创制了许多新词。可是,这本书在知觉心理学家中极其有限的接受程度,也许更多的是由于它否定了由其他人到目前为止在知觉研究中取得的几乎一切成果。吉布森典型的话如下所示(摘自他去世后发表的一篇文章):
一个世纪以来从对知觉的研究中得出的结论是微不足道的。从一个世纪以来对感觉的研究中获取的知识是不连贯的。我们没有足够的知觉理论,我们在寻找感觉当中所发现的东西是一串混杂的错觉、生理怪事和身体的感觉。这些含义是令人沮丧的。在解决知觉的问题上,必须有一个全新的开始。
吉布森之所以决定要另起炉灶的理由听上去是足够充分的:他用这个问题(跟科夫卡一样)开始“为什么事物就是它们看上去的样子”,然后说:
我们如何看出自己处于环境之中的什么地方?我们如何知道自己是不是在移动?如果是在移动,我们是在向哪里移动?我们如何知道事物的长处在哪里?我们如何知道怎样处理事情?
为了正儿八经地重起炉灶,吉布森排除掉了大多数基本的假设,这都是哲学家和心理学家们在视知觉方面一向采用的假想。其中有:感觉是知觉的基础;来自外界的刺激会引起有机体的反应;有机体能产生反应;大脑可以处理、整合并解释信息;对视觉的合适研究从视网膜和大脑开始;光学的运动是视觉系统必须加以补偿的东西;环境只是由视网膜上的信息部分再现出来;知觉在很大程度上取决于推论等等。吉布森可谓是一把新扫帚。
对前述假设加以全盘扫荡之后,吉布森提出了自己的新理论,这种理论多一些哲学意味,少一些实证基础,更多的是概念上的,而不是以资料以基础的,而且很难掌握。尽管如此,他还是通过实验达到他自己的结论的,首先是运动知觉,然后是形式和其它现实世界特点的形式。如我们在前面已经说过的,第一线曙光是从他参加航空人员研究中得出的,如他所言:
我们了解了更多有关物体知觉的东西,我认为这比通过外形知觉进行的实验室标准实验多得多。一方面,我有一个挥之不去的感觉,即从来没有人真正在生活中看到过一个二维的东西,也就是说,一个事物的图片。人们看到的是一连串视点的转换,无穷多的外形,它们可以确定物体变化了的外形。
从这里开始,他后来不仅排斥所有以图片和错觉为基础的研究,而且排斥就知觉作为思维对视网膜上的二维图片不完全的信息进行的解释的所有理论:
最终,我慢慢理解了,图片形式的知觉与自然的知觉方式是何等的不同。前者是二手的知觉;后者是一手的知觉。从图片中来到眼睛里的有框架的视觉排列,与来自世界而到达眼睛里的自然的视觉排列完全不同……眼睛之所以进化;是因为它们要看这个世界,而不是看一个图片。自从我意识到这些以后,不管是什么意义上的用途,我一概回避使用 “视网膜图象”这个词了。
吉布森的结论我们已经在前面看到,就是说,光学排列包含了我们需要的所有有关现实世界的信息。他承认,我们的对这个世界的知识由于神经系统的特性而有限,可是,他坚持认为,这些特性取决于对这个世界的进化适应,我们知道必须了解的所有环境特点。进化会在每种动物中产生一个知觉系统,会使它直接辨认对其有用的环境的特点——按吉布森的说法是“可利用性”,即任何东西的特征的利用都会使这个物种受益。因此,事物相对于观察者的大小和生理装备来说,看上去是可食用的、可饮用的、可以在上面行走的、可以在里面游泳的等等。
简短地说,知觉不是对一种降格视网膜图象的解释过程,而是通过光学排列和光学流动直接和真实的现实体验。这对吉布森而言,就是知觉的核心机制——而不是由胡贝尔和威塞尔(他们进行的工作他认为是无关的)记录下来的神经现象,也不是认知过程,他认为认知过程是以错误和人工的假设为基础的。
直接知觉也是吉布森对贝克莱的回答。我们知道,世界就在那里,在我们之外独立地存在着,因为当我们在环境中移动时,我们以连续变化的形式看见事物,而我们会体验到事物的连续性、真实感,且不依赖我们作为观察者而存在。其它的所有动物亦是如此。只有哲学家们才会去怀疑世界不是我们看上去的样子。吉布森的视知觉理论因而就大胆突破了对视觉的研究,从而进入认识论的领域。
这还不算完。到他生命快要终结的时候,吉布森慢慢相信,知觉是全部心理学的支柱,而他的知觉理论可以给这门科学的许多领域带来巨大的变化。像思维、意识、学习和驱动力这样一些概念,都可以被生态心理学所代替,而生态心理学是以动物对地点、事件和物体有用的、危险的特征的意识为基础的,也是以他们对自己的动作进行组织和控制,以达到他们在现实世界里所欲求的结果为基础的。
吉布森经由何种过程以期达到这种至高无尚的目标的,我们不得而知。《生态心理学》出版两年后他就去世了,尽管他有关视知觉,特别是光学流动的一些思想已成为被接受的知识的一部分,可是,这些知识和他更为雄心勃勃的一些概念却并没有给知觉带来一场革命,更不用说总体意义上的心理学。
很可惜,吉布森会变得这样不能宽容,这样自负,他的光学流动概念当然是很有价值的,尽管它并不会使他认为的许多东西毫无必要,可是,他爱走极端的性格使他对心理学作出的贡献不能像它应该的那样广为接受。
所有这些会把我们引向哪里?
《心理学年报》1991年对知觉问题的回顾提出了全部三种方法——神经生理学的、认知学的以及吉布森式的方法——并认为这三种共同存在的理论和知识体系彼此并非互相排斥。以刺激为基础的神经学方法、以人类思维进行的认知方法和光学流动直接法都描述了全部现实的不同部分。他们并非彼此冲突和矛盾的,而是互补的。
从这个立场出发,知觉好像就是心理学知识当中相对发达的一个领域,尽管有许多谜尚未解开。对这些有趣的问题,还有太多而不是太少的答案,但是,现代心理学其它的研究领域也是这般情景。未来是否会产生一个包罗万象的综合理论,这还需要时日来证明。同时,我们知道,我们已经了解了比以前多得多的知觉方面的情况,而且知道,还有更多的知觉知识尚需了解。