14-5 运动控制的生态学理论（AGI基础理论）

《智能的理论》全书转至目录****

不同AGI的研究路线对比简化版：《AGI（具身智能）路线对比》，欢迎各位参与讨论、批评或建议。

运动心理学家研究的一个热点问题是运动员怎样实现运动技能的控制。基于不同的理论原理，专家们对运动技能的控制有着不同的解释。按照知觉维度划分可将运动控制分为间接知觉理论和直接知觉理论，其中开环控制和闭环控制理论、协同理论均属于间接知觉理论，而可供性理论是直接知觉理论，即生态理论，的重要内容。

一.间接知觉理论和直接知觉理论（宫照玮，2018；冯建立和张宏杰，2013）

1.间接知觉理论（信息加工理论）

间接知觉理论的代表理论是信息加工理论，信息加工理论认为，外部的各种刺激如视觉、听觉、触觉等通过眼睛、耳朵、皮肤等感受器进入大脑，就如同通过录音、键盘、打字等方式将信息输入计算机一样，之后大脑通过一系列的措施将进入的信息进行登记、编码、储存，如同计算机的一系列处理、运算、存储程序。当再次需要使用某一信息时，大脑将会对记忆进行检索以提取相关信息，并将提取出来的信息传出到效应器从而产生动作反应，如同麦克风和显示器。

该理论认为个体从外界获得的只是一些感觉，感觉只能提供对某一客观事物个别属性的反映，它是贫乏的、不够丰富、不能提供完整信息的。因此需要个体将它们累加起来，经过心理加工形成关于外在世界的知觉（9-1：视觉通路，知觉和感觉的区别），这包含利用记忆、习惯、定势等进行推理的加工过程。

2.直接知觉理论（生态学理论）

与信息加工理论迥然不同，生态学理论认为感觉是知觉的一部分，而知觉是直接的（人对环境能够直接产生整体的知觉）。生态心理学家Gibson假设有机体周围分布着丰富的环境信息，环境本身提供给人的信息是足够，且这些信息能够被直接知觉而非间接的，既人类对某种刺激所得的知觉经验，乃是由刺激本身特征引起的，不需要由心理予以组织而后再判断。他在研究中发现，飞行员能够直接地获取飞行中天空和地面的相关信息，并据此实施具体的飞行操作。

生态知觉理论认为，动物和人类在数十亿年的进化中，不断适应外界环境的变化，对外界的刺激产生的反应不断积累，最终在面对相同的刺激时能直接产生相对应的动作反应，而不需要先通过大脑做出一系列操作。同时，除了环境会影响人的行为，人类所进行的动作也会影响周围的环境，如当人想要伸手去拿起桌子上的杯子时，周围的环境使人知道杯子所处的高度、距离等信息，影响着人伸手这一行为，但同时因为人在伸手的同时使手与杯子的位置信息也发生了变化，使得环境信息也发生了改变，所以伸手的动作和杯子的位置信息都在不停地变化，人的行为和环境相互影响。

3.两种理论在运动操作中的差异

（1）知觉预测

间接知觉理论解释知觉预测时，非常强调长时记忆中过去经验的重要性。以羽毛球的拦截动作为例，当我们做阻截动作时，不但要判断物体的速度和轨迹，而且要估算物体到达的时间和地点，过去经验有助于我们预测这些相关信息。这时，长时记忆中存储的信息和短时信息的感觉输入信息进行对比，进而在不完全感知相关信息的情况下做出判断。这就需要运动员平时积累大量运动技能经验，并在运动中迅速抓住关键信息，才能确保知觉预测的准确性。

而对于直接知觉理论而言，行为是个体和环境相互作用的结果，环境中的信息可以被直接利用而无需进行复杂的神经加工。这使直接知觉理论在解释快速反应上具有时间上的优势。

（2）知觉决策

对于间接知觉理论而言，决策就是在一定情形下，我们如何运用知觉和过去经验，决定采取什么行动。首先，感觉信息输入到中枢神经，在知觉阶段被解释，然后输送到短时记忆，这些短时记忆中的信息通过和长时记忆中的过去经验进行比较后，再由其他中枢神经做出决策。

根据直接知觉理论，中枢神经只需设置行为目标，即"做什么"。对于怎么去做，则是以一种自发的形式发生。环境允许或限制我们的行为，我们对每一个环境对象的知觉，都包含着它与我们行动之间关系的理解。比如人类的阶梯一半在0.5米以下，在限制高度范围内的允许人类踏上，如果超过0.5米，那么人类可能就不是用踏的方式登上。环境和个体是动态变化的，环境和个体相互作用导致行为的发生。

（3）动作控制

从间接知觉理论来说，在动作控制中，中枢神经系统发挥着指挥中心的作用，整个动作控制是在已有经验的基础上，中枢神经系统能够从相关经验中提取重要的信息片段，并将其组成一套规则（动作程序）。当要进行新的运动技能时，大脑会将动作信息进行提取然后添加到一般动作程序中以完成这项运动技能。

而从直接知觉理论来说，中枢神经系统主要作用仍然只是设定目标，它输送到周围神经系统的信息不是对肌肉的详尽指导，而是一个一般的指令，四肢的移动是由环境和个体相互作用的结果，周围神经系统的调节作用远比中枢神经系统重要。

二.可供性理论

可供性理论是生态知觉理论中的一项重要内容，这一理论由Gibson提出。他指出可供性是环境提供给动物行动的机会，即环境信息会"告诉"动物在当前的环境中，什么是可以做的，什么是无法做的，如果可做可以做到怎样的程度。

1.定义

可供性是Gibson于1979年提出的概念，这一概念特指环境或客体向观察者提供关于动作可能性的信息，是架构在环境的视觉布局与观察者行为之间的一座桥梁。通俗地说，可供性是物体本身蕴含的一种信息，就如同物体其他物理信息，如咖啡色、木制等信息一样，但却不像物理信息那么直观可见，而是客体隐含的动作承担特质。比如人可以坐在椅子上，其可供性指的是椅子蕴含的"可以供人坐"的信息。以"人走上楼梯"为例，以人的腿长的88%为界，当台阶高度低于它时，人就可以顺利迈上楼梯；当台阶的高度高于它时，人只能用其他方式走上楼梯。比如一个腿长1米的人当然可以顺利走上一阶高度为0.5米的楼梯。即，在由二者所构成的"动物-环境系统"中，就蕴含了"人走上楼梯"这一事件实施的可能性，该阶梯为该人提供了"上楼梯"的可供性。

可供性由于世界的性质和动物的活动能力共同确定，它的存在意味着动物和环境的一种匹配。首先，环境的意义和价值包含了它能提供什么，这种意义和价值通过探测可供性信息而被感知。比如茶杯可供性是和手的尺寸以及握力有关，以至于它能被抓握。同时，客体的动作可供性也依赖于客体使用者的具身性。比如，对人类来说物体水壶承载着可以抓握的动作属性，但是对于狗来说水壶提供不了这种属性（Thill，Caligiore，Borghi和Ziemke等人，2013）。

Gibson（1979；1977）提出可供性理论认为，感觉的本质目的是指导动作，对环境的感知是为了行动，可供性的产生是基于客体的复杂知觉属性之上，不需要对客体进行高级认知加工就可以直接激活。在Gibson等人设计的视崖实验中显示，3个月以下的缺乏深度知觉的婴儿，在面临悬崖边缘时，有立即停滞不前的现象，此实验说明悬崖的危险性是直接感知到的。

根据Bub，Masson和Cree（2008）的分类，每种客体都蕴含两种可供性：一种由客体形态引发的可供性，称之为形态可供性，它通过客体的形态体积激活相应的动作手势；另一种由客体使用经验和其功能信息引发的动作手势激活，称之为功能可供性。对于一些客体来说，典型的形态手势和功能手势是一致的。以杯子为例，抓握杯子和用杯子喝水所用的手势一致。当然也存在另外一些客体，形态手势和功能手势不尽相同，比如说遥控器，抓握遥控器和使用遥控器跳台所用手势大不相同。

2.朝向效应和尺寸效应

在认知心理学领域，可供性的概念被进一步发展，研究者称之为子-可供性（Ellis和Tucker，2000；Vainio，Ellis和Tucker，2007）。子-可供性关注的不是整个动作，而是具体的动作成分，它包含朝向效应和尺寸效应两种。

（1）朝向效应

当观察到带有手柄的客体时，会激活不同的手腕方向，比如当水杯手柄朝左时，会激活左手腕，而当水杯手柄朝右时，会激活右手腕。这一效应被称为朝向效应。Tucker和Elis（1998）呈现日常生活中带有手柄的物品图片给被试（比如水杯，螺丝刀，茶壶）。这些物品或正立或倒立，并且手柄随机朝左或者朝右，如图1。要求被试用左手或者右手按键判断这些物品是正立还是倒立，如图2。实验结果显示，当手柄朝向和按键位置处于同一侧时相对速度更快，比如当手柄朝左时，左手反应更快（相对于右手反应）。这种现象也可作为支持客体可供性的直接证据。

图1

图2

但有学者认为，出现的"刺激-反应"一致性效应，是因为刺激材料本身的视知觉信息所蕴含的注意编码引发了注意偏向，导致了刺激位置和反应位置的一致性效应（Proctor和Vu，2006），它本质是一种Simon效应，而非客体可供性引起的。面对这一质疑，Tucker和Elis（1998）的一项实验中改变了被试的反应方式，将双手反应改为单手，通过右手的食指和右手的中指进行反应。结果发现单手反应的实验中，"刺激-反应"一致性效应不显著。在单手反应的实验中，一方面，视觉刺激保持不变，那么由注意编码引发的注意偏向的程度也不变，如果是由Simon效应引起的，那么应该仍然能观察朝向效应现象，但结果如此相反；另外一方面，对于朝左和朝右的把手刺激，都只是通过右手反应，朝左和朝右的刺激把手提供的可供性信息，引发的动作激活相同，所以并不会引起朝向效应，这与结果一致。总的来说，这一研究进一步证明了引发朝向效应的原因，是动作层面的客体可供性，而非视知觉层面的注意编码。

Simon效应存在两方面的不同。首先，Simon效应指，当刺激的呈现位置与被试进行反应的空间一致时，即使刺激呈现的空间位置与任务无关，人们对刺激目标特征的反应仍然更快更准（Simon，1969）。比如当被试看到屏幕上出现红色时，应按下右侧的按钮，当他们看见绿色时，应按左侧的按钮。颜色刺激可以出现在左侧或者右侧。参与者通常被告知忽略刺激的位置，并根据任务相关的颜色做出反应。但是，如果比起出现在左侧，被试对出现在右侧的红色反应更快。可供性与操作物体的手有关，而与位置无关，比如刺激可以放在中间的位置，但是根据刺激的朝向（手柄朝向）操作它的手的便利程度不同；其次，在任何加工水平下，Simon效应都会自动激活与刺激位置同侧的注意（Prinz和Hommel，2002）。而可供性效应能否发生，与被试对刺激材料的加工程度有关，许多研究认为当被试的反应任务仅停留在简单的感知阶段，可供性效应并不会出现，比如颜色判断（Ellis和Tucker，2007）。然而当被试的任务是关于形状判断或者是意义判断时，可供性效应才会出现。例如判断客体是正立或是倒立、判断客体通常使用场所是在厨房还是在工作室、判断客体是人工物品还是自然物品（Tipper，Paul和Hayes，2006；Zhao，Bai和Wang，2015）等任务，才能引发动作可供性效应。换句话说，在任何反应加工层面，Simon效应都会产生，但是对于浅层加工，可供性效应并不会产生。

（2）尺寸效应

当观察到大小不同的客体，会激活不同的抓握动作，包括精细抓握和力量抓握。Tucker和Ellis（2001）在实验中发现，呈现常用物品的照片，其中半数客体为使用力量抓握客体，需用手掌部位操纵（如榔头、瓶子），另外一半客体为使用精细抓握客体，需用拇指和食指操纵（如瓶盖、图钉），在刺激呈现之后，通过采用两种抓握反应方式表达呈现目标客体是人工物品还是自然物品（如被试精细握反应表示刺激是人工物，用力量抓握反应表示这是自然物）。结果显示，当目标为日常使用精细抓握的客体，精细抓握的反应更快（相对于力量抓握）；而当目标为日常使用力量抓握的客体，力量抓握的反应会更快（相对于精细抓握）。这一效应被研究者称为尺寸效应。

3.模型

（1）直接知觉理论

Gibson（1979）认为视觉场景中的众多客体都承载着动作的可供性，比如椅子承载着可以坐的动作的可能，茶壶会引导我们去抓握。同时，同一客体也可能承载着许多不同动作的可能性，如足球承载着踢、扔、拿、抓、拍等动作。Gibson认为这些动作可能性主要是由视觉场景中客体的知觉特征和使用者的具身性所决定，不需要对客体进行高水平的认知加工，仅仅通过观察客体的结构性特征即可觉察（Ellis和Tucker，2000）。

（2）TRoPICALS模型

Caligiore等人（Caligiore，Borghi，Parisi和Baldassarre，2010）提出了TRoPICALS模型。该模型认为，前额叶皮层产生的关于个体需求的自上而下的信息和客体所激活的自下而上的动作信息被传送到某种竞争机制中，并对这些信息加以整合以做出后续反应。此时，个体需求的动作与客体激活的动作间的一致性就产生了基于朝向或尺寸等的一致性效应，即客体动作可供性效应；当二者不一致的时候就会产生冲突竞争，从而导致较慢的反应。比如，当客体（花生）激活的动作与目标"判断任务需要的动作"一致时（如都是精细抓握），此时被试反应就会快于不一致条件下的反应。

4.影响因素

（1）反应任务

研究发现，任务所要求的加工深度可能会调节动作可供性的启动动作的能力。其中，客体语义判断的加工深度最深（如判断客体是人工物还是自然物），形状判断次之（判断客体是什么形状），颜色判断（判断客体是什么颜色）。Tipper，Pau和Hayes（2006）操纵不同物理特征的判断任务，发现动作可供性效应在形状判断任务时出现，而颜色判断任务并未发生。研究者认为物体的颜色属于客体表面特征，而形状是客体的结构性特征，客体表面特征的知觉可能与结构性特征的知觉是独立的。且相比于颜色判断，形状判断对客体进行了更深层次的加工，更容易激活对客体的动作。另外，研究发现客体的语义信息的激活也会影响客体动作可供性，完成判断任务需要的加工层次越深，越容易激活客体承载的动作。但仍有部分学者认为动作可供性的激活是基于客体结构性特征的，而不需要提取语义，只是在语义信息特别强时才能通过语义信息激活客体承载的动作。

（2）客体的状态

Tipper，Paul和Hayes（2006）根据客体动作状态，将客体分为激活状态与静息状态。静息状态的客体指的是自然状态下没有受到外力的客体，即该客体未被施加动作。目前大多数研究都采用这类客体，比如把柄朝右的平底锅并没有实际动作作用在把手之上，这种客体会直接明确地激活右手。而另一种是激活状态下的客体，被明显的暗示出有动作施加其上，如门把手受到压力，处于被扭动的状态，如图3。研究表明，处于激活状态下的客体，能够引发更大的客体可供性效应。Umiltà等人（Umiltà，Kohler，Gallese和Fogassi等人，2001）的神经生理学研究发现，正是因为镜像神经元的存在，所以当被试观察被扭动的门把手时，尽管没有看见操作把手的手势，仅凭客体状态便能使被试感知他人施加于客体之上的力量（Ferrari，Rozzi和Fogassi，2005）。

图3

（3）距离因素

距离因素指客体位置和观察者的动作范围影响刺激反应一致效应，比如说，因为客体距离人较远，给人以够不到客体的感觉，那么客体引发的动作激活程度大大减小，而当客体在观察者可伸够距离之内，相对容易激活相应动作（Grifiths和Tipper，2009）。

5.可供性的抑制效应

（1）反应任务

许多研究表明，工具的功能部位容易引起个体的注意，比如Cho和Proctor（2011）对功能部位突出的客体（如茶壶）进行了研究，发现视觉上壶嘴部位比把手部位更吸引观察者的注意。由于功能部位的突出特征，使观察者的注意偏向功能部位，背离另一侧的把手部位，抑制了与把手部位相关的动作反应，因此引发客体可供性的逆转（Anderson，Yamagishi和Karavia，2002；Matheson，White和McMullen，2013）。但是这一研究结果不能被推广，Matheson，White和McMullen（2013）的研究发现，可供性是否发生发转，与被试任务有关。仅在物品分类任务中，如判断客体是人工物品还是自然物品时，被试注意偏向集中在客体功能部位，易化了与功能方位同侧的按键反应，导致客体可供性效应的反转。但是在判断物品的正立倒立任务时，可供性效应仍旧存在。他们认为，关注物品功能部位并不能成为解释可供性反转的原因。而是当反应任务无需调用语义，不会引发客体可供性的反转。因为当任务反应涉及语义知识时，被试需要调用客体的功能信息，更加关注于客体的功能部位而非与功能关联不大的把手部位，因而出现可供性效应的反转。

（2）时间进程

Vainio等人（Vainio，Hammaréna，Hausena和Rekolainena等人，2011）提出了可供性效应发生反转的抑制机制，他们发现当启动刺激客体呈现时间很短时（30ms或70ms），出现可供性效应的反转；而当刺激呈现时间较长时（170ms或370ms）可供性效应不会反转。他们解释，当启动刺激保持呈现在屏幕上时，被试通过观察客体，所获的可供性信息逐渐激活，当积累直至达到动作激活阈值时，就产生动作计划，使其产生可供性效应。但当启动刺激呈现时间很短时，在动作表征形成的萌芽阶段就被突然中断，便抑制了动作表征的形成，因而导致了反转的可供性效应。

6.导航可供性

Gibson（1979）认为一块平整拓展的地面如果能够支持有机体行走或奔跑于其上，就可以证明可供性的存在。面对复杂多样的空间构造，有些是可以行走的，有些是阻碍前行的，有些是会坠落的。其中对于人与环境交互过程中直接知觉到的"可通行"的功能属性，研究者将其称之为导航可供性（Gregorians和Spiers，2022），比如生活中常见的通道。相反，没有导航可供性指的是在限制移动过程中所知觉到"不可通行"的功能属性，其中空间几何结构扮演着重要的角色，比如墙壁、玻璃等。

三.配对客体动作可供性（公艳艳，2022）

1.定义

日常生活中经常一起使用的客体，比如水杯和水壶，不仅具有单一客体的可供性的动作反应，也承载着一定的合作动作。比如在客体正确联合定位时，即水壶倾斜一定角度指向水杯时，水壶与水杯之间形成"倾倒"的合作动作，此时对两客体的范畴判断（是否为同一范畴）要快于当两客体之间未形成合作动作关系（水壶口远离水杯）时的，即产生了配对客体的动作可供性效应。

2.施动客体与被动客体

关于配对客体的界定，Riddoch等人认为日常生活中经常一起使用的客体为配对客体，并依据人们对客体的使用习惯将两客体的角色界定为施动客体与被动客体。其中，施动客体是生活中常引发动作的客体（如水壶），被动客体为承受动作的客体（如水杯）（Riddoch，Humphreys，Edwards和Baker等人，2003；Riddoch，Humphreys，Hickman和Clift等人，2006；Green和Hummel，2006）。配对客体中的施动客体常处于使用状态，如水壶倾斜45°指向水杯时如同日常生活中正在倒水的状态，此时施动客体处于激活状态，因此可能更容易引发动作。配对客体包括客体对（日常生活中是否经常一起使用）及合作关系（是否正确联合定位）两个因素构成。

3.研究范式

Riddoch等人（Riddoch，Humphreys，Edwards和Baker等人，2003）对视觉消失病人进行了一系列的研究，研究中给被试呈现日常生活中常见的配对客体，如"酒瓶-开瓶"，"钉子-锤子"等，操纵配对客体间相对位置，发现同时呈现在左右视野的两客体在正确联合定位条件下（具有合作动作时，如一个开瓶器指向酒瓶口位置）与不正确联合定位条件（无合作动作时，如开瓶器远离酒瓶口位置）相比，视觉消失病人对两客体的正确报告率显著提高，即出现了配对客体动作可供性效应，且具有施动客体的报告优势（施动者激活程度更高）。

4.模型

（1）动作获取双通路模型

Yoon等人（Yoon，Heike和Humphery，2002；Yoon，Humphreys和Riddoch，2010）在众多研究的基础上提出，动作获取存在两条可以并行运作且相互补充的通路：直接通路与间接通路（如图4）。直接通路是指关于客体的结构描述系统到动作输出系统的通路，即通过对客体结构性特征的加工直接激活客体的动作信息（如呈现客体"杯子"便激活"喝"的动作），而无需提取客体相关的语义信息。第二条通路是动作提取的间接通路，此通路中动作信息先后通过结构描述系统，语义系统然后才是动作输出系统（呈现"杯子"时，需要必须先通达杯子是如何使用和杯子是什么等语义知识，才能激活"喝"的动作）。客体的结构描述系统存储客体视觉相关的特征信息，语义系统包含客体的语义联想知识，尤其是动作语义信息。

根据动作获取的双通路模型（Yoon，Heike和Humphery，2002），由于间接通路比直接通路多一个节点（语义系统），因此当物体呈现时，动作通达（作出使用客体的相应动作）快于命名通达（命名该物体）。另外，正确动作选择也能反馈给语义系统，帮助通达正确语义表征，从而促进正确命名。这就能够解释大量脑损伤病人出现的状况。例如，视觉失语症的损伤出现在图中的A位置，由于从视觉到语义知识的通路受到阻碍，因此病人无法正确地对物体分类。但由于从词汇到语义知识的通路保持完好，所以病人能对词汇分类。又因为物体本身和动作知识之间存在直接通路，所以病人虽然不能分类物体，却能对物体做出正确动作。语义痴呆病人的损伤出现在图中的B位置。由于语义知识严重损伤，病人无法回答物体的范畴知识，更不能经过语义知识通路通达物体的动作知识。但病人却能根据物体的视觉刺激正确地执行动作。视觉运动不能症的研究证明，从视觉物体到动作知识存在两条通路。这种病人有正常的物体命名和识别能力，并能根据给出的物体名称做出正确动作（词汇到动作知识之间的通路保持完好），却不能对物体的视觉刺激做出正确动作反应。因此，此类病人的损伤发生在图中的C位置。

Yoon等人（Yoon，Humphreys和Riddoch，2010）基于客体动作提取的双通路假设解释了配对客体动作可供性的概念。日常生活中，当两个客体经常一起使用时可以改变或形成客体结构描述系统和动作输出系统之间的联系。例如，当人们反复用右手抓握水壶，用左手抓握的水杯，并经常一起使用时（如水壶向水杯倒水），水壶和水杯之间会形成配对客体的整体性结构表征，从而产生配对客体合作动作发生的可能性。显然，该理论也能解释单个客体的可供性。

图4

（2）功能群组假设

Riddoch等人（Riddoch，Humphreys，Edwards和Baker等人，2003）认为，基于动作的群组知觉表征有助于减少视觉对象之间的选择竞争。因此当配对客体正确联合定位形成熟悉相关客体对时，熟悉的功能群组表征可能使得组成配对客体的两客体同时被选择。就像单词-优势效应一样，当字母出现在熟悉的单词中时比单独出现时更容易识别，其中一种解释是当字母呈现在熟悉的单词时，单词水平的心理表征被选择性激活，从而利化字母的识别（Rumelhart和McClelland，1982）。

5.影响因素

（1）客体动作信息激活强度

Xu，Humphreys和Heinke（2015）发现了对施动客体的反应优势，同时发现了在两客体间存在合作关系时，合作动作对被动客体的反应抑制。

（2）客体对熟悉性与联合定位

Riddoch等人（Riddoch，Humphreys，Hickman和Clift等人，2006）研究中比较了熟悉客体对（日常生活中经常一起使用，酒瓶与酒杯）、不熟悉但看上去有合作关系的客体对（酒瓶与桶）和不可能一起使用的客体对（酒瓶与羽毛球）间的动作可供性效应，发现熟悉客体对、不熟悉但看上去有合作动作的客体对在正确联合定位条件时视觉消失病人的视觉消失现象得以恢复，而在不能一起使用的客体对中未发现这种效应。另外，把不经常一起使用的客体放在熟悉位置（例如太阳在树的上边）与不熟悉位置（例如太阳在树的下方），视觉消失病人的视觉消失现象均没有得到改善。这两个实验均表明，配对客体动作可供性效应可能是基于客体间与动作相关的结构性特征而非只是基于客体视觉熟悉性（是否经常一起出现）。

四.τ理论（闫京江，2011）

1.碰撞时间

时间信息是一种认知变量，需要动物和人类通过感知觉获得，并用来协调环境与生物体之间的互动。在最近的几十年间，心理学家对动物和人类采用何种时间变量以及其特定的感知机制等进行了大量的研究。在这些时间变量中，一个被广泛研究的是碰撞时间（TTC），即从某一时刻起，到物体与观察者发生实际碰撞所剩余的时间。

2.信息加工理论的估计

为了能够在复杂多变的环境刺激中估计碰撞时间，不同的研究者提出了几种不同的理论来解释碰撞时间的获得机制。其中，比较著名的两种理论为：信息加工理论和生态学理论。传统的信息加工理论认为，动物和人类在进行碰撞时间时，首先需要对其与将要碰撞物体之间的即时速度（v）和相对距离（d）进行估计，然后再计算时间信息（t=d/v）。这个过程需要从眼睛所感知到的各种视觉变量开始，经过计算距离和速度，间接地得到时间知觉，因此，这种理论认为碰撞时间的估计是一种从环境刺激到时间知觉的间接转化过程。这种理性的加工方式通常需要大量的神经资源和时间对信息进行加工，因而有可能会影响时间估计的效率和速度。因此，当需要快速反应时，间接知觉理论可能无法提供理想的可靠性和准确性。

3.单眼τ理论

（1）计算

与信息加工理论不同，生态学理论强调知觉是视觉系统与外界刺激的直接产物，是外界的直接反映，因此不需要借助于高级思维的参与（如逻辑推理、记忆提取、信息计算和信息整合等）。为了解决动物和人类是如何进行剩余碰撞时间估计的问题，Lee提出了τ理论（Lee，1976）。这个理论认为，当物体与观察者之间相向运动时，从某一个时刻起到二者发生碰撞所剩余的时间（τ，即TTC）可以通过物体当时在视网膜上的成像的夹角（2θ）与这个夹角的变化率（d(2θ)/d(t)）之间的比值来获得，见公式1和图5。

式1

图5

（2）优势

在日常的活动中，为了抓取或者击中一个飞来的物体，人类的活动通常需要受到非常准确的控制，从而能够在准确的时间位置上抓取到物体。例如，在网球、板球和乒乓球等体育运动中，为了能够及时地击打到某些高速运动的球，往往需要运动员的击球动作与标准时间之间误差不能大于2毫秒，差别阈限也要低于10%（Regan，1992；Bootsma和van Wieringen，1990）。为了将自己的行为与外界刺激在时间上达到协调一致，就需要运动员对时间变量的感知达到一个相当高的准确性和稳定性。由于τ变量所具有的感知时间短，占用的中枢资源少，准确性高的特点，使得观察者从环境中直接获得该时间信息，而不需要通过高级认知过程对距离、速度、加速度等进行计算。因此，τ理论也要比信息加工理论更具知觉上的优势。

（3）限制

然而，τ理论的成立有很多前提条件：（a）物体与观察者之间的运动需要为匀速运动；（b）根据公式定义，τ信息为物体与观察者之间的碰撞剩余时间。因此，物体需要与观察者之间发生相对运动，而且需要物体正对观察者眼睛的碰撞；（c）根据实验数据所得，物体的半径与速率之间的比值（r/v）足够小（<1）的时候，计算所得的τ信息才会与真实碰撞时间相类似。而当r/v 较大的时候，它们之间存在着一定的误差。由于在现实环境中，对物体速度的估计往往需要比较长的时间，而且物体的速度的变化范围往往比较固定，因此，可以粗略地认为τ公式需要以物体不能够太大为前提，以保证公式的准确性；（d）物体的视觉成像的大小和扩展速率需要大于人类的觉察阈限，否则如果2θ太小人类无法察觉到视觉成像的大小，或者d(2θ)/d(t)太小也无法察觉视觉成像的扩展速率（Gray和Regan，1998）；（e）物体在视网膜上投射的形状是规则的，如视网膜上的投影从大正方形变成小正方形；否则d(2θ)/d(t)失效，如大正方形变成小长方形无法得出视网膜投影大小的变化率。

这些前提条件在很大程度上限制了τ变量作为时间信息来源的适用范围。例如，τ变量不能为那些从侧面经过的物体提供时间信息（不是向眼睛方向移动，第（b）条）（von Hofsten，1983），这显然与现实不符，例如足球守门能知觉足球从身边飞过的剩余时间。

（4）拓展理论

为了解决τ变量的一些局限性并拓展理论的使用范围，研究者先后对这个理论进行了修正。包括以下3种拓展和修订：第一种修订描述了观察者自身运动时，视觉视野扩张的中心点的变化（Lee，1980）。当观察者运动时，整个环境（包括所有物体）的影像都会在观察者视网膜上产生相对于其视线注视点的运动，即全局光流信息（9-10：运动感知）。这时，如果观察者的视线在运动过程中保持固定，那么视野中的物体影像会逐渐偏离视线关注点。在这种情况下，物体的影像到视线关注点的距离r以及其单位时间的变化率d(r/t)同样可以提供准确的碰撞时间信息，即τ=r/d(r/t)；第二种修订则关注于物体视网膜成像上的任意2个不同点之间的扩张（Lee，1976）。在某些情况下，观察者只需要觉察到物体上的任意一对不同点即可。在物体的影像扩张的同时，其结构中的任意部分的影像也在扩张，并且部分与整体的扩张速率可以认为始终保持一致。因此，使用物体上的任意2个点所组成的直线结构同样可以估计TTC；最后一种则定义了运动物体的整个影像在视网膜上的扩张率（Lee和Young，1985）。运动物体的映像作为一个整体被观察者所感知，因此可以从整体中获取τ信息用以估计时间。由于第一种τ信息与观察者自身的运动有关，因此又被称为整体τ信息，而其余两种仅与运动物体自身有关，而不受视野中的背景信息的影响，因此称为局部τ信息。

经过修订后的τ理论可以在更广泛的场景中解释碰撞时间估计行为。例如，在物体向观察者运动但其运动方向与观察者的视线之间存在一定的角度时，物体最终可能并不会与观察者发生碰撞，而是从观察者的身边经过。例如，棒球运动员击打一个将要从其身体中心线外0.5米处飞过的一个球。在这种情况下，观察者需要估计球飞过其自身所在的垂直平面的时间，以便于准确地做出击球动作。由于物体并不是沿着观察者的视线做正面运动，物体自身的视觉映像并不是由其中心向外扩大，因而无法使用最初的τ理论。但是使用扩展的理论（第一种修订），观察者可以从环境中获取物体运动方向与视线方向的视角变化及该视角变化的变化率，并根据它们之间的比值在物体迫近过程中来估计物体剩余的经过时间（Bootsma和Oudejans，1993；Tresilian，1999）。

4.双眼τ理论（Gray和Regan，1998；Tresilian，1999；Rushton和Wann，1999）

（1）计算

在最初的τ理论中，研究人员仅仅关注于通过单眼所形成的碰撞时间信息，而动物通常都具有对称的双眼。当物体向观察者靠近时，物体与双眼之间的夹角会逐渐变大。由此，研究者认为，观察者的双眼视差同样也会提供一种类似于单眼观察条件下的τ变量信息（Gray和Regan，1998；Regan和Beverley，1979），即

（2）推导过程

如图6，当物体朝向观察者以速度v进行运动时，O点可以是任意能够被观察者看到的一个距离比较远的参考点（需要它处于观察者的中心视线上），2θ为O点与双眼之间的夹角，O'为物体运动一段距离后所在的位置，2β为O'与双眼之间的夹角，δ/2为θ与β之间角度的差值（根据三角形的角度关系可得：β=θ+δ/2），D为此时物体与人双眼连线的中点的距离，l为双眼之间的距离，通常认为人类双眼间距的l值为6厘米左右。

图6

根据正切公式，求得：tanβ=tan(θ+δ/2)=I/2D

当参考物体O足够远的时候，它与人眼的视线形成的夹角2θ可以足够的小。例如，当该参照物距离人眼6米或更远时，θ<0.005，这时候的角度θ接近于0，可以忽略。得到：

tan(δ/2)=I/2D

即D=l/2tan(δ/2)

此时，根据时间等于位移除以速度，可以得到：

其中，d(D)/d(t)为物体的速度。

5.声音τ理论

（1）计算

在某些场合中，动物还可以利用听觉刺激的变化来估计相对应的碰撞时间信息。当一个能够发出声音的物体向观察者运动时，观察者能够听到物体运动所带来的声音强度变化。这种声音强度上的变化是逐渐增强的，因此这种变化很有可能也会使观察者从中知觉到碰撞时间信息。Shaw，McGowan和Turvey（1991）提出，声音会提供与物体视觉夹角变化相类似的运动时间信息。因此，当观察者在听到物体运动过程中发出的声音时，就可以利用这种τ信息来估计TTC，其中τ=d/v，并以此为根据做出相应的动作反应。例如，当动物听到周围环境的异常声音时，会立刻产生警觉并作出相应的反应。

（2）推导过程（Shaw，McGowan和Turvey，1991）

声音的强度I的变化与声源与观察者的耳朵之间的距离d的平方成反比，即I=kd-2。其中，k为已知的固定常数。由于距离d可以由物体的速度v与时间t乘积得到，并且假设物体的速度在某一次运动中为已知。因此对声音强度的时间变化求导，得到：

其中，d(I)/d(t)为声音强度的变化率。

将τ等于声音强度与其变化率导数的比值计算得到：