《智能的理论》全书转至目录****
不同AGI的研究路线对比简化版:《AGI(具身智能)路线对比》,欢迎各位参与讨论、批评或建议。
一.定义
人类对视觉信息的感知在很大程度上都依赖于客体对象的一系列基本属性,例如对比度、亮度、颜色、空间频率等。其中,空间频率是指单位视角内图像或者视觉刺激的明暗作正弦调制的周期数,通用单位为"周期/度"(cpd)。在视觉研究中,研究者将低于2cpd的空间频率称为低空间频率,将高于6cpd的空间频率称为高空间频率。(Boeschoten,Kenemans,van Engeland和Kemner ,2007)
二.低频分量与高频分量
一个视觉刺激通常由多个不同频带的分量叠加而成,可分解为低频分量与高频分量。研究表明,不同频带的空间频率信息在视觉系统中由不同的视觉通道进行加工,低空间频率信息主要通过大脑的大细胞视觉通路进行加工,高空间频率信息则主要通过小细胞视觉通路进行加工。不同的空间频率表征着外界刺激的不同视觉属性。具体来说,高空间频率信息主要表征外界刺激中较为细节的部分,如边界及纹理等;而低空间频率信息主要表征外界刺激中较为粗略的信息,如朝向、形状、构型等特征。以面孔刺激为例,低空间频率信息主要表征面孔的整体轮廓,而高空间频率信息则提供更加详细的面部特征,如脸上的皱纹。(Bar,2004)
此外,从V1出发可以分离出两条视觉通路:背侧通路和腹侧通路。一些研究者认为,背侧通路和腹侧通路分别是大细胞通路和小细胞通路的延展,背侧通路对低空间频率信息敏感,而高空间频率信息则主要由腹侧通路传递。(Skottun,2015)
三.从粗糙到精细
有研究表明高低空间频率信息在加工过程中遵循着从粗糙到精细的规律。对低空间频率信息的加工往往早于高空间频率。研究者使用正弦光栅作为视觉刺激观察到大脑对低频信息的加工相对于高频信息具有时间优先性。Schyns与Oliva(1994)使用两种不同种类且具备不同空间频率的场景刺激(例如,低频的城市图片与高频的高速公路图片)进行图片叠加获得混合刺激图片后进行实验(如图1),发现当混合图片的呈现时间非常短(30毫秒)时,图片的分类主要依赖于低频信息;相反,当呈现时间较长(150毫秒)时对其分类则主要由高频信息主导。同时,有神经生理学的研究表明,不同空间频率视觉信息的传递并不同步,低频信息抵达初级视皮层的时间比高频信息更早。场景刺激的低频信息比高频信息更快地到达枕叶以及背侧通路的高级脑区(例如顶叶及额叶),从而促使大脑对视觉输入进行粗略的感知分析(Bullier,2001)。

图1