在上一篇文章中,我们讨论了杭州互联网法院全国首例"生成式 AI 幻觉"侵权案。
法院没有纠缠"AI 准不准",而是明确了三件事:
-
AI 不具备民事主体资格
-
AI 的"承诺"不构成法律意思表示
-
责任不在模型,而在系统是否尽到了合理注意义务
这一步,已经把讨论从"AI 技术能力"推到了系统设计与治理层面。
问题也随之发生了转移:
如果你作为架构师,明知生成式 AI 存在幻觉风险,
却仍然设计了一个"无人裁决、无人兜底、直通决策"的系统------
责任会不会追溯到你?
答案,已经越来越接近"会"。
一、从"模型出错"到"架构过失",责任正在上移
很多架构师仍然习惯这样理解风险:
"模型是黑箱,出错不可避免,这不该算我的责任。"
但司法与合规体系采用的,并不是"模型视角",而是工程视角。
杭州互联网法院在判决中引入的核心标准,并非"是否出错",而是:
是否在可预见风险下,尽到了合理的系统性注意义务。
而今天,有三件事实已经成立:
-
生成式 AI 存在幻觉风险,已被学界、产业界、司法反复确认
-
金融、医疗、司法等属于显著高风险决策场景
-
AI 输出可能直接影响他人重大利益
在此背景下,如果系统仍被设计为:
-
AI 输出直接进入决策链
-
无裁决节点
-
无人工复核阈值
-
无风险阻断与回退机制
那么问题就不再是"模型偶然犯错",而是:
你是否在架构层面,放行了一个已知存在风险的决策路径。
这正是"过失"在工程语境下的真实含义。
二、过失不是道德评价,而是结构判断
在侵权与职业责任中,"过失"并不是一句道德指责,而是一个非常具体的问题:
是否存在合理、可行、行业已知的风险防范方式,而你没有采用。
放到 AI 系统架构里,这个问题会变得异常具体:
-
能否识别高风险场景?
-
是否区分"辅助生成"和"决策建议"?
-
是否设置人类确认边界?
-
是否具备拒绝、冻结、回滚能力?
-
是否能审计 AI 在"为什么没回答"?
这些能力,在今天并非前沿幻想,而是:
-
技术上可实现
-
成本上可接受
-
治理层面被反复强调
在这种前提下,完全不部署裁决层或功能等价机制,已经很难被解释为"合理选择"。
三、国际标准已经给出明确答案:必须有"不能做"的能力
如果说司法判例解决的是"出事之后怎么办",
那么国际标准解决的,是"你有没有资格进入高风险场景"。
目前,多项国际规范在一个问题上高度一致:
AI 系统必须明确其不能做什么。
无论是负责任 AI 框架、工程伦理规范,还是审计认证体系,都反复强调三点:
-
系统必须存在清晰的人类监督边界
-
系统必须具备可解释的拒绝与中止逻辑
-
系统不得在缺乏问责机制的情况下自主行动
这意味着一个现实变化:
"拒绝能力",已经从"附加功能",变成了合规准入条件。
一个什么都能回答、什么都敢给结论的系统,在治理视角下并不是"强大",而是不可控。
四、组织压力正在把风险回流到架构师身上
很多人以为,合规风险最终由法务或管理层承担。
但在实践中,事情往往并非如此。
在金融、医疗、公共治理等领域,一旦因 AI 输出导致:
-
监管处罚
-
系统性误判
-
群体性风险
内部追责往往首先指向一个问题:
这个系统,为什么会被设计成这样?
此时,模型供应商很少成为第一责任人,
而系统架构决策,会被视为风险源头之一。
在越来越多的组织中,已经出现一个明确趋势:
-
能否"拒绝执行",成为审计重点
-
是否具备裁决层,成为采购前提
-
架构师开始被纳入"系统性风险责任链"
这并不是夸张,而是现实正在发生的转向。
五、拒绝机制不是保守,而是系统的"免疫系统"
很多技术人员本能地排斥"拒绝",认为那意味着能力不足。
但在高风险系统中,拒绝恰恰是成熟的标志。
一个具备裁决层的系统,通常遵循这样的逻辑:
-
当输入含糊 → 拒绝,强制人工介入
-
当责任主体缺失 → 拒绝,阻断决策链
-
当上下文发生漂移 → 拒绝,重置状态
这不是"不敢做",而是知道什么绝对不能做。
正如核电站中的安全棒------
它的存在不是为了提高发电效率,
而是为了在系统即将失控时,能够自动插入、立即中止。
六、架构师的生存悖论:越"能做",越要"不能做"
| 传统认知 | 现实正在发生的变化 |
|---|---|
| 架构师的价值 = 让 AI 回答更多问题 | 架构师的价值 = 让 AI 不回答错误的问题 |
| AI 越智能,架构师越轻松 | AI 越智能,架构师越要 严格设限 |
| 技术驱动业务 | 合规驱动技术选型 |
当 AI 能力不断增强,
"边界设计"正在成为架构师最核心的专业能力。
结语:这不是技术选择,而是职业底线
当生成式 AI 被引入高风险场景,
"有没有裁决层"已经不再是架构风格之争,而是一个更直接的问题:
你是否为系统的"不能做"负责。
真正成熟的架构,不是让 AI 无所不能,
而是确保------
在任何时候,系统都知道该停在哪里。