AGI发展蓝图：基于【能力与自主性】的双维度可操作化框架

🌐 AGI发展蓝图：基于【能力与自主性】的双维度可操作化框架

来源: arXiv:2311.02462 https://arxiv.org/html/2311.02462
核心目标: 打破哲学辩论的僵局，提出一个可量化、可比较、具备操作指导意义的通用AGI评估框架，指导我们理解AI的发展路径和潜在风险。

本文抛弃了单点式、单收敛点的AGI定义。AGI的真正发展需要一个多维度的系统视角，该系统由两个主要的、必须同时评估的维度构成：

能力维度 (Performance/Generality): 衡量"能做什么" (What Can It Do?)
- 可操作性: 衡量AI的能力广度（Generality，领域覆盖范围）和深度（Performance，单任务的顶尖水平）。
- 关键原则: 必须定义在**认知任务（Cognitive）和元认知任务（Metacognitive）**上。
自主性维度 (Autonomy): 衡量"需要人干预的程度" (How Much Oversight is Needed?)
- 可操作性: 描述AI在执行任务时，人类需要介入的程度。这是进行风险评估的参照物。

这是最关键的评估工具，用一个矩阵将AGI的各个阶段进行定位：

能力水平 (行) ↓\downarrow↓ / 任务广度 (列) →\rightarrow→	窄域 (Narrow / Scoped)	广域 (General / Wide Range Tasks)	当前定位评估 (LLM)
Level 0: No AI	传统计算器；编译器	人工操作（如: Mechanical Turk）	现状基线
Level 1: 初现级 (Emerging) (对应"非熟练人类")	GOFAI; 简单规则系统 (如SHRDLU)	新兴 AGI: ChatGPT, Bard, Llama 2, Gemini	✅ 当前前沿大型语言模型 (LLM)
Level 2: 有能级 (Competent) (Top 50% Human)	智能助手 (Siri, Alexa); VQA系统	有能级 AGI: 尚未实现	目标阶段
Level 3: 专家级 (Expert) (Top 90% Human)	文档辅助 (Grammarly); 图像生成模型 (DALL-E 2)	专家 AGI: 尚未实现	目标阶段
Level 4: 卓越级 (Exceptional) (Top 99% Human)	国际象棋程序 (Deep Blue); AlphaGo	卓越 AGI: 尚未实现	长期目标
Level 5: 超人类级 (Superhuman / ASI)	蛋白质折叠 (AlphaFold); AlphaZero	超人类智能: 尚未实现	长期高风险目标

⚠️ 关键风险结论: 现有前沿LLM处于 Level 1 General AI 的地位。其最大风险点在于：表现出的"有能级"能力 (如写作流畅度) 极易被误认为其在所有任务上都已达成了"有能级"的评估。

理想的基准必须是**"活的基准"（Living Benchmark）**，重点测试以下三种高阶人类能力：

认知任务 (Cognitive): 语言逻辑、数学推理、空间几何学。
元认知任务 (Metacognitive):
1. 学习能力: 适应新技能，无需重复训练。
2. 自我校准: 识别自身知识盲点，并主动请求外部帮助。
3. 心智理论 (Theory of Mind): 理解社会互动和目标偏差。

AGI能力（Capability）与人类的**自主性依赖度（Autonomy Level）**是两个必须独立评估的参数。

自主性等级	定义	适用场景	引入的主要风险
Level 0: 无AI	人类做所有工作。	分析方法论，手工流程。	固有风险。
Level 1: 工具 (Tool)	人类完全主控，AI仅自动化子任务。	搜索引擎、语法检查器。	技能退化（De-skilling），对人工劳动的颠覆。
Level 2: 顾问 (Consultant)	AI承担实质性角色，但需持续监督。	复杂的诊断辅助系统。	决策层面的过度依赖和信任盲区（Over-reliance）。