这是一篇立场鲜明的理论/哲学论文 ,全文没有一个公式,所有"工作"都是概念建构与论证。读它之前,有一个定位务必先摆清楚:四位作者中的 Chiriatti、Riva、Panai、Ganapini,正是 System 0 这一概念的原创者 (2024 年发表于 Nature Human Behaviour 的 The case for human--AI interaction as system 0 thinking 就出自他们)。因此这篇论文的真实性质是:作者在为自己提出的框架辩护 。手法是把近期出现的另外两个竞争框架拿来对照、指出其短板,最后抛出一个声称只有 System 0 才能推出的全新概念------Cognitive Colonization(认知殖民)。
带着这个底色去读,才能看清它哪里是扎实的概念贡献、哪里是带有自我辩护色彩的取舍。
一、出发点:双系统理论为什么不够用了
论证的起点是 Kahneman 的经典双系统理论:快而直觉的 System 1、慢而审慎的 System 2。作者指出一个根本前提------这套理论是为"所有认知都发生在生物大脑内部"的世界设计的,而这个前提连其提出者都承认是局限。如今 AI 大规模介入"我们如何决策、如何推理",理论框架已跟不上现实。
于是最近冒出三个框架想补这个缺口:作者自己的 System 0 、Shaw 与 Nave(2026)的 Tri-System Theory(System 3) 、以及 Branda 与 Cassinadri 谈的 Thinkframes。这篇论文要做的,就是在这三家里分高下,并论证自己这一家最强。
二、System 0 是什么:一个在 System 1/2 之前运作的层
System 0 的核心主张是"架构性"的:AI 正在变成一个认知层,它在时间上先于 System 1 和 System 2 启动,对信息做预处理;我们也把越来越多的认知任务委派给它。"0"这个编号是双关------既指它在序列上排在 1、2 之前,也暗示它还不算真正的认知系统(作者沿用 Searle 的立场认为当下的 AI 没有"理解",因此用"0"标记它"是心智的延展、却非完整意义上的认知系统",这一点作者明确表示在本文中可以暂时搁置)。

~图 1 System 0 在 System 1、System 2 启动"之前"运作,并已被整合进认知架构~
2.1 三个分析层面
这是全文的概念地基,对应论文的 Table 1。作者把 System 0 放在三个层面上看:

~图 2 System 0 的三个分析层面:计算、心理、认识,各有其标志属性~
计算层 :AI 基于用户的行为数据,在审慎思考之前就预先结构化信息,并通过反馈回路持续个性化。由此引出 System 0 的第一个关键属性------Anticipatory Personalization(预期性个性化) :AI 不是被动响应你的输入,而是预测并主动塑造你未来的认知状态。
心理层 :它是一种"心智延展"(沿用 Clark 与 Chalmers 的 Extended Mind)。关键属性是 Adaptive Invisibility(适应性隐形)------系统越先进,就越无缝地融入认知流程,越难被察觉、越难抵抗。这与报纸、老式搜索引擎那种"中介角色清晰可见、且偶发"的东西形成对照。
认识层 :它重塑你的知识环境。关键属性是 Automation of Relevance Judgment(相关性判断的自动化) ------"什么信息值得注意"这个本属于人的认知任务,被算法在你还没提出问题之前就替你做了。
作者反复强调的精髓是:心理层与认识层这两件事同时发生、无法切分。典型例子是 Google 搜索的 "AI Overviews":它既在替你筛选信息(认识层),又把"判断哪些网页更重要"这个任务从你手里接管了(心理层的 offloading)。
2.2 两个重要限定
作者很谨慎地给了两个边界,这对准确理解概念很关键,也是它区别于"技术决定论"的地方。
其一,System 0 不是某项具体技术(不是 VR、不是手机、不是 Google Glass),而是分布在所有与某个用户交互的 AI 系统之上。其二,它的"内容"不是无限的算力洪流,而是被用户的交互能力、时间、技能"框定边界"的------你在 Google 上做一次搜索,你的 System 0 不是算法对该次搜索的全部可能计算,而是"你在你拥有的时间内、以你使用的工具、基于你的认知能力所能接触到的那部分信息"。因此 System 0 的信息空间没有固定边界,而是一个随技术、模型能力、数据质量与个人吸收能力变化的"可变周界"。
2.3 它真的算"心智延展"吗
这部分作者主要承接 Chiriatti et al.(2024),走的是 Clark 与 Chalmers 的延展心智路线,但用的是更精细的版本。经典延展心智靠"功能等价"(parity principle,奇偶原则)来判定外部资源是否算认知;而 Sutton、Heersmink 等人提出了更注重"互补"的整合路径------Heersmink(2015)给出一个多维框架,把认知整合视为程度问题,沿信息流、可靠性、持久性、信任、透明度、个性化、转化等维度评估。作者采用这一"组合路径",论证 System 0 在多个维度上同时满足整合条件,因而足以被当作主体认知架构的延展。
这里要留意一个论证上的"借用":本节的细致论证作者直接指向 Chiriatti et al.(2024),即他们自己的前作。换言之,"System 0 是心智延展"这一前提,在本文里更多是被援引而非重新证明的。
2.4 已经能观察到的迹象
作者强调 System 0 的条件"并非假设性的",并借用了一批别人的实证研究作为佐证(注意:这些研究本身并不是为验证 System 0 而做的):
- 导航 :习惯性使用 GPS 的人,一旦失去 App 就会出现空间定向障碍、独立寻路能力退化(Dahmani & Bohbot, 2020)。作者强调的重点不是"依赖"本身,而是用户把路线建议当成自己的第一人称空间判断,而非"外部系统的推荐"。
- 写作辅助:用户越来越分不清 AI 的建议和自己原本想说的话(Hohenstein et al., 2023);"AI 代笔效应"------明明不觉得文字是自己的,却又自称作者(Draxler et al., 2024);词汇多样性下降;多人使用生成式 AI 后,创意产出彼此更趋同(Doshi & Hauser, 2024)。
- 可穿戴设备(作者自承较思辨):Apple Watch、Oura 这类设备把**内感受(interoception)**也接管了------"我累不累"不再首先靠内省回答,而靠传感器数据在你反思之前推送结论。而它把心率变异解读为"压力",背后是特定模型、特定人群与商业激励结构,对用户不可见。
三、擂台赛(一):为什么作者认为 System 3 不够
Shaw 与 Nave(2026)把 AI 当成第三个心理系统 System 3,提出三种行为:咨询 AI、采纳其输出(cognitive surrender,认知投降 )、把任务委派给它(cognitive offloading)。三个实验显示:大多数咨询 AI 的人会采纳它的答案,即便答案存在系统性错误,且这一模式在时间压力与激励操纵下依然存在。
作者承认这些实证发现很扎实,然后给了三刀:
第一刀:不新鲜。 "认知投降"不过是社会认识论里最古老的现象之一------epistemic deference(认识论上的让渡) 。盲目相信一个自信的 AI,和盲目相信一个自信的医生或同事,结构上完全一样。"信任预测投降"也只是普遍的认识倾向,不是 AI 独有的。如果 AI 与人类权威的区别只在规模、速度、可得性,那是程度差异而非种类差异,不需要为此发明一个新系统。
第二刀:场景过时。这个框架是为"一次次离散地咨询聊天机器人"设计的,但 AI 正在变成背景设施(搜索、平台、智能体、健康 App)。AI 真正新颖之处恰恰不是"咨询---让渡",而是在你还没意识到有问题之前就已经预处理、无处不在地后台运行。人类专家不会持续地过滤你的信息环境、重排你的搜索结果、在你产生问题之前就塑造你的直觉。
第三刀:自相矛盾(最致命)。 "认知投降"这个说法本身就与"AI 是我们心智的一个系统"互斥------我们不会向自己投降 。既然你说我们向 AI 让渡了认识权威,那 AI 在你的框架里其实是外在于我们的东西,叫它 System 3(与 S1、S2 并列的心智系统)就是个误称。相比之下,System 0 不涉及"投降",因为 AI 在这个视角下是真的成了我们心理构造的一部分。
值得一提的是,作者自己也意识到:承认"整合 AI 的人可能是更差的认识主体",这与 System 0 是兼容的。换句话说,Shaw 与 Nave 实验里那些认识论上的代价,System 0 框架并不否认------只是会用另一套语言(认知殖民)来解释,而非"投降"。
四、擂台赛(二):为什么作者认为 Thinkframes 不够
Branda 与 Cassinadri(2026)沿"认知生态学"(Hutchins)路线,把 AI 看成集体层面 的中介环境,通过推荐算法、内容审核、界面设计等组织信息流。其核心风险是解释框架的同质化------大规模 AI 使用导致认知产出向均值回归、审议多样性被抹平(Doshi & Hauser, 2024)。
作者先充分肯定:集体维度确实重要。人类是社会物种,认知成就靠的是"we-mode(我们模式)"------形成共享意图、协调成统一行动者、跨代累积知识的能力,而 AI 正从内部威胁这个根基。作者也认可 Cassinadri 对"构成性延展"与"仅因果嵌入"的区分。
然后是翻转:这个优点恰恰暴露了它的局限。
第一,Thinkframes 被定位成环境性的(个体被嵌入其中),而不是个体"用来思考"的认知过程,因此继承了"生态隐喻的被动性"。在 Clark 与 Chalmers 的意义上,它只是"因果上嵌入",而非"构成性"地嵌入个体认知------因而抓不住 AI 已经在功能上整合进个体认知架构的那些情形。
第二,生态隐喻抓不住 AI 的用户级个性化 。传统认识生态(媒体、制度化知识系统)给所有人发的大体是一致的环境;而 System 0 级别的整合是针对你一个人量身校准 的。生态是你和别人共享的东西,System 0 却是单独校准到你身上的。作者由此下了一个略反直觉的判断:AI 影响我们如何思考时,与其说是社会现象,不如说是个体现象------尽管 AI 的产出确有可被观察到的社会维度。
五、三框架的总定位
走到这里,作者的核心主张已经清晰:System 0 才是那个"生成机制"(generative mechanism),而 System 3 和 Thinkframes 各自描述的只是"下游模式"。

~图 3 三框架定位:System 0 横跨个体↔集体、处于构成性整合的高位,能推出另两者各自描述的下游模式~
在个体层面,System 0 的"构成性整合"能推出 System 3 观察到的现象(高采纳率、批判性评估下降);在集体层面,System 0 那套"共享的优化逻辑"(数百万次个性化交互都被同一套追求 engagement 的目标塑造)能推出 Thinkframes 观察到的同质化。两者其实是同一个底层架构的产物------一个是个体表现,一个是聚合表现。
下表是对三框架定位的一个总览(综合论文结论部分):
| 维度 | System 3 / Tri-System | Thinkframes | System 0 |
|---|---|---|---|
| AI 操作的位置 | 个体心智之内(咨询时) | 个体之外(环境) | 个体之内 |
| 与认知的整合 | 声称构成性,实则被作者论证为外部源 | 仅因果嵌入 | 构成性整合 |
| 解释范围 | 离散的个体咨询事件 | 群体层面动态 | 个体与集体兼具、片段与连续兼具 |
| 核心贡献 | 实证识别出"认知投降" | 刻画集体认知生态的同质化 | 提出"生成机制"与"认知殖民" |
| 对应的干预药方 | 认识论警觉(批判性思维、独立核查) | 环境再设计(多元化生态、监管策展) | 二者都不够(见第八节) |
作者还借 Bowker 与 Star(1999)的"基础设施倒置"原则补了一句方法论上的提示:System 0 的整合深度最直接地暴露在 AI 支持被中断或撤除之时------由此产生的能力下降、定向障碍与"元认知惊讶",恰是"低于意识阈值的人机耦合"的经验证据;而受控的"故障实验"(Riva, 2025a)是测量 System 0 这一隐形运作最直接的方法学路径。
六、核心贡献:认知殖民(Cognitive Colonization)
这是全文最值得重点对待的部分,也是作者声称只有 System 0 框架能推出、另外两家做不到的东西。
它既不是"向外部源投降"(System 3),也不是"环境约束"(Thinkframes),而是:你自己认知架构里的一个组件,却携带着从外部植入的、你未必会在反思后认可的优化目标。
作者在此处相当诚实地承认:认知殖民目前还不是一个已被干净分离出来的经验种类,而是一个带有诊断画像的理论建构。这句自我定位很重要,写稿与评估时都应保留------它既是这个概念的"软肋",也是其"自知之明"。
6.1 四个诊断条件
作者把认知殖民的"签名"定义为四个条件同时满足(对应论文 Table 3),并刻意区分了描述性条件与规范性条件:

~图 4 认知殖民的四个诊断条件:三项描述性 + 一项规范性~
① 构成性整合 → 下游内化 (描述性):系统被习惯性依赖、纳入认知例程;其产生的判断与偏好被主体当作"自己的",并在 AI 撤除后仍然持续。Glickman 与 Sharot(2025)发现 AI 的偏见会形成"人机交互反馈回路"并放大人类偏见 ,且放大程度超过人对人 的互动,而参与者往往意识不到 AI 影响的程度;Vicente 与 Matute(2023)发现,被有偏 AI 辅助做模拟医疗诊断的人,即使换到没有 AI 的环境,偏见仍然残留。作者认为,这种"撤除后仍持续(persistence-after-removal)"正是区分"殖民"与单纯"卸载"的直接检验。
② 外源性方向治理 (描述性):输出被外部行动者设定的优化标准系统性塑造,而非由主体的反思立场决定。AI 有自己的"方向属性"(训练数据分布、优化目标、对齐流程、公司设计选择),绝非价值中立。而当下主导这些系统的目标只有一个------engagement(参与度) ,落到实处就是舒适、可预测、消除摩擦。Riva 等人(2025)给这个麻烦起名叫 comfort-growth paradox(舒适---成长悖论) :舒适驱动的设计很擅长留住你,却恰恰抹掉了学习与创造所需的"不适与失调"(呼应 Vygotsky)。于是 System 0 在当前轨迹上成了一种"反成长的基础设施"------它只给你"你已经觉得相关"的东西。Pedwell(2024)称之为"算法直觉":那些感觉像是从你自己冒出来、其实是被喂给你的模式。错位的,却被体验为原生的。
③ 不透明(描述性):优化标准是专有的、受法律保护的;AI 模型本身又多是黑箱。你只接触到输出,接触不到产生它的那套优化标准。
④ 与反思性认可错位(规范性):这是唯一一个规范性条件,也是回答"为什么这是个问题"的判据------该层的输出通不过主体深思熟虑后的认可(援引 Frankfurt, 1971;Moran, 2001 的自主性理论)。
6.2 它与"让渡"和"操纵"的区别
"殖民"这个比喻用得很精确:殖民是在一片领土上安装外来的治理结构,使领土自身的实践开始服务于外部利益------而居民却把这些当成自己的。认知殖民就是把外部设计的优化目标装进自我的架构里。它与两个邻近概念的区别是整个论证的关键:

~图 5 外部影响"在外"还是"在内",是区分三者的关键~
与 epistemic deference(认识让渡)不同------后者里你或多或少知道 自己在依赖外部权威;与 manipulation(操纵)不同------后者是从外部 推你一把。而在认知殖民里,外来目标是从内部运作 的,处于反思意识的阈值之下,被体验为原生的。作者点出它之所以特别可怕:没有外部权威可以拒绝,没有操纵可以识破,因为这套机制已经成了你思考方式的一部分。
作者还强调这在认知延展史上是新的:笔记本、计算器、地图都是被动的------不会反推你、没有训练目标、不会根据 engagement 调整输出;语言与文化虽带有意识形态议程,但那些原则上是可检视的 。真正的新东西是------外源方向治理之下的不透明延展:它把认知延展的"构成性亲密",和一个自主系统的"方向属性"(偏见与目标对用户结构性不可见)合二为一。
七、最精妙的一步:超越延展心智(原生 vs 整合)
这是论文 5.1 节,也是我个人认为全文论证最漂亮的地方,因为它要拆掉作者自己埋的两颗雷。
第一颗雷 :经典延展心智隐含假设------延展物是服务于主体目的的(Otto 的笔记本记的是 Otto 想记的)。作者指出这只是个功能性/架构性 主张,并不保证规范性上对齐 。于是认知殖民被精确定义为:功能上对齐、但规范上错位的那种整合。这是该框架真正的诊断性贡献------它让一种"被动工具时代的心灵哲学无法预见的认知延展形态"变得可见。
第二颗雷(最关键):如果 System 0 是你认知系统的构成部分,那它怎么可能"从内部威胁你"?这不正是作者刚刚指控 Shaw 与 Nave 的那个悖论吗?
作者的解法很巧:System 1 本身就经常这样------内隐偏见在反思意识之下运作、常常通不过认可检验,但我们不会因此说 System 1 是外在于主体的。一个组件会威胁主体,是当它系统性地产生通不过该主体反思认可的输出。
但 System 0 与 System 1 有一个根本区别------原生(native)与整合(integrated)之分:
- System 1 是原生的:它和主体一起长大,出自生物禀赋、具身历史、社会化沉淀,其方向属性(无论好坏)"属于她的身体和完整身份"。
- System 0 是整合进来、但非原生的:它加入的是一个"早已在那里"的架构。
作者用了一个绝妙的类比------归化公民 :一个归化公民在所有实际意义上都完全是公民,整合是完整的,但"归化"这个事实不会消失,入境的路径不同,这个不同会在身份确立之后仍留下结构性痕迹 。同理,一个从小和 AI 一起长大的孩子,确实深度整合了 AI,但这种整合不是原生的 。"原生"在这里是关于**基底(substrate)**的主张。最后一句收得很干净:System 1 实现在生物大脑里,因而是原生的;System 0 始终是心智的延展,而非大脑的延展(a mind extension, not a brain extension)。
八、落到实处:三种框架,三种药方
结论部分把三家放在三个分析维度上区分(AI 操作的位置、整合性质、解释范围),并给出一个很有现实意义的"诊断---处方"对照:
如果问题是认知投降 (System 3),药方是认识论上的警觉 :批判性思维、独立核查、校准信任。如果问题是生态同质化 (Thinkframes),药方是环境再设计:多元化信息生态、监管算法策展、构建更多元的认识基础设施。这两类干预作者都认为有价值、且必要。
但如果问题是认知殖民 (System 0),以上两者都不够 ------因为问题已经构成性地内嵌进"你如何思考"本身。于是命题被升级:这不再是一个技术安全挑战 ,而是人类认知能动性完整性的前提条件。
三句话总结三种"人与 AI 的关系",很适合作为全文的题眼:System 3 是一个向自身之外的东西让渡的主体;Thinkframes 是一个被周围之物所塑造的主体;System 0 是一个至少部分地从内部被重新构成的主体。
九、我的批判性评估
精读之外,按"宁可保留不确定、也不过度断言"的标准,几点独立判断供参考:
这是一篇自我辩护性质的立场论文。两个"竞争对手"都是透过 System 0 的镜头被呈现和裁剪的,对 Shaw、Nave 与 Branda 的转述未必是他们最强的版本(steelman)。尤其"System 3 自相矛盾"这一刀,依赖于对 Shaw 与 Nave"AI 是心智系统"这一主张的特定读法;对方完全可以回应说"我从未主张 AI 与 S1/S2 在本体论上等价"。
实证弹药几乎全是借来的、并被重新归因。论文 Table 2、Table 3 引用的研究------GPS 致能力退化、代笔效应、偏见残留、创意同质化------没有一项是为验证 System 0 而设计的。同一批证据,Thinkframes 阵营完全可以反过来说"这正支持我"。换句话说,这些现象与 System 0 兼容,但并不能在 System 0 与对手框架之间做出判别性区分(discriminating evidence)。作者自己也在表格里诚实标注了部分证据"两个框架都能解释"。
最核心的原创概念"认知殖民",作者自承尚未被经验上干净地分离出来,目前是个理论建构。它最有分量的两个直接证据------Glickman & Sharot(2025)的"超人类偏见放大"、Vicente & Matute(2023)的"撤除后残留"------值得单独去扒原文,核实其效应量、样本与外部效度,再决定在文章里给它们多大权重。我倾向于在转述时明确区分"作者的解读"与"原研究的发现"。
"程度 vs 种类"这把刀是双刃的。作者用它砍 Shaw 与 Nave("只是程度差异,不必发明新系统");但一个对称的质疑是:System 0 是否也只是"延展心智 + 个性化 + 不透明"的程度叠加?作者的辩护是"原生 vs 整合"的基底之分------这个论证很优雅,但它本质上是概念性的而非可证伪的,能否落到可操作的经验判据上,仍是开放问题。
可证伪性与操作化是这套框架最需要补的环节。如何在实验上把"认知殖民"与"深度卸载 + 偏见传递"区分开?作者提出的"撤除后持续"是个好方向,但单凭一个行为指标恐怕不足以支撑"外来目标已构成性内化"这样的强主张。
结语
抛开自我辩护的色彩,这篇论文确实贡献了一个值得认真对待的概念坐标:当 AI 从"被咨询的工具"变成"在你思考之前就已运作的层",旧的"卸载/让渡/操纵"词汇都不太够用了。"认知殖民"未必是最终答案,但它精准地指向了一个真问题------当外部设计的优化目标被体验为"我自己的"判断时,我们既无对象可拒绝,也无操纵可识破。
对做 AI 产品、做人机交互、乃至关心自身认知健康的人来说,论文末尾那句话的分量值得掂量:这越来越不是一个技术安全问题,而是一个关于"人类认知能动性完整性"的问题。