ZGI四层能力架构：一个企业AI底座的设计逻辑

一、一个根本问题：企业需要什么样的AI底座？

过去两年，我接触了上百家正在落地AI的企业。有一个问题反复出现：

"我们用了很多AI能力------GPT-4、Claude、DeepSeek、各种开源模型。每个人都用得挺嗨，但作为技术负责人，我问自己三个问题，一个都答不上来：

公司到底花了多少钱？

哪些能力是资产、可以复用？

出了合规问题，谁能负责？"

这不是个别现象。

AI工具的普及速度，远超企业组织能力的建设速度。结果是：工具越强，管理越弱。

这篇文章想聊的，是一个更底层的问题：企业到底需要一个什么样的AI底座？

ZGI的四层能力架构，是我们对这个问题的回答。

二、设计理念：从"工具集成"到"能力底座"

在ZGI的设计中，我们区分了两个概念：

|------|--------------|------------|
| 概念 | 定义 | 特点 |
| AI工具 | 解决单点问题的软件 | 分散、异构、难以管控 |
| AI底座 | 承载所有AI能力的平台层 | 统一、可管、可演进 |

ZGI的定位是后者------企业AI底座。

它不是又一个"AI应用"，而是让所有AI应用能够规范运行、有序沉淀、安全可控的基础设施。

基于这个定位，我们设计了四层架构：

三、第一层：接入层------统一入口，降低接入成本

3.1 要解决的问题

在没有统一底座之前，每个AI应用都要自己对接模型厂商、处理API差异、管理密钥。结果是：重复造轮子、密钥散落各处、切换模型成本高。

3.2 设计思路

接入层的核心是统一API网关：

所有AI能力通过同一套API暴露
支持HTTP、WebSocket、gRPC多种协议
自动处理模型厂商的API差异
统一的密钥管理与鉴权

3.3 技术实现要点

接入层做的事情：

将gpt-4路由到OpenAI、claude路由到Anthropic
统一处理重试、超时、降级
记录原始请求/响应（用于审计和复盘）

3.4 价值

|---------|----------------|
| 指标 | 效果 |
| 新应用接入时间 | 从天级降到分钟级 |
| 模型切换成本 | 改一行配置 vs 改全部代码 |
| 密钥管理 | 统一管理 vs 散落各处 |

四、第二层：管控层------安全合规，成本可控

4.1 要解决的问题

企业环境里，AI不能"裸奔"。需要回答：

谁在调用？调用了什么？
花了多少钱？预算还剩多少？
有没有敏感数据泄露风险？

4.2 设计思路

管控层是ZGI最核心的差异化能力，包含四个模块：

4.2.1 多模型智能网关

支持OpenAI、Claude、DeepSeek、Llama等主流模型
自动健康检查与故障转移
支持AB测试（10%流量走新模型对比效果）

4.2.2 细粒度权限管控

4.2.3 安全防护与脱敏

敏感信息自动识别（手机号、身份证、邮箱）
支持自定义脱敏规则
输入输出双向过滤

4.2.4 审计日志

记录每次调用的完整链路
日志不可篡改，满足合规要求
支持按用户、应用、时间范围检索

4.3 价值

|------|------------|
| 能力 | 解决的问题 |
| 智能网关 | 模型厂商单一故障风险 |
| 权限管控 | 谁能用什么、用多少 |
| 安全脱敏 | 数据泄露风险 |
| 审计日志 | 合规审查、问题追溯 |

五、第三层：能力层------开箱即用的业务组件

5.1 要解决的问题

企业常用的AI场景高度重复------合同审查、入职档案解析、Text-to-SQL、知识库问答......每个团队都在重复实现同样的功能。

5.2 设计思路

能力层封装了高频业务场景的端到端能力：

Text-to-SQL：自然语言直接生成SQL

自动理解数据库Schema
内置安全防护（禁止DELETE/DROP）
支持复杂查询（多表JOIN、子查询）

合同审查：自动提取条款、标注风险

支持NDA、销售合同、劳动合同等多种类型
风险点带原文引用
可配置风险规则库

入职档案解析：自动提取身份证、毕业证、离职证明

支持20+种证照类型
结构化输出JSON
准确率95%+

知识库问答（RAG）：基于企业文档的智能问答

支持多种文档格式（PDF、Word、Markdown）
自动分块、向量化、检索
可追溯原文位置

5.3 使用方式

5.4 价值

|-------------|-------|-------|
| 能力 | 自建成本 | 使用ZGI |
| Text-to-SQL | 2-3人月 | 1天接入 |
| 合同审查 | 1-2人月 | 2天接入 |
| 入职档案解析 | 1人月 | 1天接入 |

六、第四层：治理层------资产沉淀，持续演进

6.1 要解决的问题

这是最容易被忽视、但长期来看最重要的一层。

很多企业用了一两年AI后，发现：

每个人都在重复写同样的Prompt
踩过的坑反复再踩
老员工走了，经验也带走了

结果：AI能力无法沉淀为组织资产。

6.2 设计思路

治理层的核心是让每一次调用都变成可复用的资产：

资产沉淀

Prompt版本管理：每次修改都有记录，可回溯
效果对比：同一个任务，不同Prompt的效果对比
复用统计：哪个Prompt被调用最多

效果度量

准确率追踪：人工标注正确/错误，持续优化
成本分析：按团队、应用、模型、用户多维度统计
ROI计算：投入产出比可视化

持续迭代

Badcase收集与复盘
A/B测试框架
模型自动升级建议

6.3 价值

|------|-------------------|
| 能力 | 解决的问题 |
| 资产沉淀 | 能力跟着人走 vs 能力留在平台 |
| 效果度量 | 凭感觉优化 vs 数据驱动优化 |
| 持续迭代 | 一次性的项目 vs 持续演进的平台 |

七、四层架构的协同逻辑

四层架构不是孤立的，而是层层递进、相互支撑：

text

用户请求 → 接入层（统一入口） → 管控层（鉴权、脱敏、限流） → 能力层（执行业务逻辑） → 治理层（记录日志、沉淀资产）

一个完整的调用链路：

业务应用通过统一API发起请求
管控层验证权限、检查预算、脱敏敏感信息
能力层执行业务逻辑（如Text-to-SQL生成SQL）
治理层记录本次调用的完整信息
响应返回给业务应用

关键设计原则：

接入层无状态：可水平扩展
管控层可插拔：安全策略可动态配置
能力层模块化：新能力可独立接入
治理层异步化：不影响主流程性能

八、适用场景与选型建议

|-------|-------------------------|--------------------|
| 企业阶段 | 典型特征 | 建议 |
| 探索期 | 1-2个场景试用，月成本<2000元 | 直接用模型API，不需要底座 |
| 成长期 | 3-5个部门在用，月成本5000-20000元 | 开始出现管理问题，建议接入管控层 |
| 成熟期 | 多场景规模化，月成本>20000元 | 需要完整四层架构 |
| 强监管行业 | 金融、医疗、政务 | 必须私有化部署，管控层和治理层是刚需 |

九、写在最后

ZGI的四层架构，回答了一个根本问题：企业到底需要一个什么样的AI底座？

接入层：统一入口，降低接入成本
管控层：安全合规，成本可控
能力层：开箱即用，加速落地
治理层：资产沉淀，持续演进

这四层不是一次性建成的。企业可以根据自身阶段，从最痛的点切入：

成本失控了？先上管控层
重复造轮子？先上能力层
能力留不住？先上治理层

AI底座不是"又一个平台"，而是让AI能力能够规范运行、有序沉淀、安全可控的基础设施。

如果你也在思考企业AI底座的选型或自建，希望这篇文章能提供一些参考。

ZGI已支持私有化部署和SaaS两种模式，四层架构可渐进式落地。详情可访问ZGI官网了解。