9-5 频率感知(AGI基础理论)

《智能的理论》全书转至目录****

不同AGI的研究路线对比简化版:《AGI(具身智能)路线对比》,欢迎各位参与讨论、批评或建议。

一.定义

人类对视觉信息的感知在很大程度上都依赖于客体对象的一系列基本属性,例如对比度、亮度、颜色、空间频率等。其中,空间频率是指单位视角内图像或者视觉刺激的明暗作正弦调制的周期数,通用单位为"周期/度"(cpd)。在视觉研究中,研究者将低于2cpd的空间频率称为低空间频率,将高于6cpd的空间频率称为高空间频率。(Boeschoten,Kenemans,van Engeland和Kemner ,2007)

二.低频分量与高频分量

一个视觉刺激通常由多个不同频带的分量叠加而成,可分解为低频分量与高频分量。研究表明,不同频带的空间频率信息在视觉系统中由不同的视觉通道进行加工,低空间频率信息主要通过大脑的大细胞视觉通路进行加工,高空间频率信息则主要通过小细胞视觉通路进行加工。不同的空间频率表征着外界刺激的不同视觉属性。具体来说,高空间频率信息主要表征外界刺激中较为细节的部分,如边界及纹理等;而低空间频率信息主要表征外界刺激中较为粗略的信息,如朝向、形状、构型等特征。以面孔刺激为例,低空间频率信息主要表征面孔的整体轮廓,而高空间频率信息则提供更加详细的面部特征,如脸上的皱纹。(Bar,2004)

此外,从V1出发可以分离出两条视觉通路:背侧通路和腹侧通路。一些研究者认为,背侧通路和腹侧通路分别是大细胞通路和小细胞通路的延展,背侧通路对低空间频率信息敏感,而高空间频率信息则主要由腹侧通路传递。(Skottun,2015)

三.从粗糙到精细

有研究表明高低空间频率信息在加工过程中遵循着从粗糙到精细的规律。对低空间频率信息的加工往往早于高空间频率。研究者使用正弦光栅作为视觉刺激观察到大脑对低频信息的加工相对于高频信息具有时间优先性。Schyns与Oliva(1994)使用两种不同种类且具备不同空间频率的场景刺激(例如,低频的城市图片与高频的高速公路图片)进行图片叠加获得混合刺激图片后进行实验(如图1),发现当混合图片的呈现时间非常短(30毫秒)时,图片的分类主要依赖于低频信息;相反,当呈现时间较长(150毫秒)时对其分类则主要由高频信息主导。同时,有神经生理学的研究表明,不同空间频率视觉信息的传递并不同步,低频信息抵达初级视皮层的时间比高频信息更早。场景刺激的低频信息比高频信息更快地到达枕叶以及背侧通路的高级脑区(例如顶叶及额叶),从而促使大脑对视觉输入进行粗略的感知分析(Bullier,2001)。

图1

相关推荐
冬奇Lab29 分钟前
一天一个开源项目(第36篇):EverMemOS - 跨 LLM 与平台的长时记忆 OS,让 Agent 会记忆更会推理
人工智能·开源·资讯
冬奇Lab29 分钟前
OpenClaw 源码深度解析(一):Gateway——为什么需要一个"中枢"
人工智能·开源·源码阅读
AngelPP4 小时前
OpenClaw 架构深度解析:如何把 AI 助手搬到你的个人设备上
人工智能
宅小年4 小时前
Claude Code 换成了Kimi K2.5后,我再也回不去了
人工智能·ai编程·claude
九狼5 小时前
Flutter URL Scheme 跨平台跳转
人工智能·flutter·github
ZFSS5 小时前
Kimi Chat Completion API 申请及使用
前端·人工智能
天翼云开发者社区6 小时前
春节复工福利就位!天翼云息壤2500万Tokens免费送,全品类大模型一键畅玩!
人工智能·算力服务·息壤
知识浅谈6 小时前
教你如何用 Gemini 将课本图片一键转为精美 PPT
人工智能
Ray Liang6 小时前
被低估的量化版模型,小身材也能干大事
人工智能·ai·ai助手·mindx
shengjk18 小时前
NanoClaw 深度剖析:一个"AI 原生"架构的个人助手是如何运转的?
人工智能