导读
一个几乎每个团队都会遇到的场景:组里最好用的那个 skill、最全的领域知识库、最顺手的连数据库脚本,往往只活在某一个人的笔记本上。别人想用,得把环境在本地重装一遍、重新配一遍、再手动拼起来。更糟的是,装完之后每个人又在本地悄悄改了几刀,慢慢分叉成好几个互不相同的版本,而当初那个中心版本反而越来越旧、越来越没人维护。
私有资产沉淀不成团队资产,这是很多团队搭 Agent Team 时真正卡住的地方。模型可以随时换,prompt 可以重写,但一套攒不起来、流动不动的资产,会让整个团队的 AI 能力停留在"个人手艺"阶段。这篇文章不讲怎么一步步搭平台,而是给一套判断框架:先想清楚每一类资产该用什么方式分发,很多沉淀和复用的难题会自己消解掉。
一、先定义清楚:什么才算 AI 资产
"AI 资产"这个词很容易被泛化成所有跟 AI 沾边的东西。先立一个筛子。一个东西能被称作资产,要同时满足三条:创建它花了成本、它能跨人跨任务复用、它随时间积累会增值。只满足前一条的(比如某次一次性的 prompt 调试记录)是消耗品,不是资产。
按这个标准,团队里真正值得当资产经营的,是下面这几类:
| 优先级 | 资产类型 | 是什么 | 为什么这么排 |
|---|---|---|---|
| P0 | 评测集 / Eval | golden 用例、回归集、打分标准、评测脚本 | 没有它,其他资产的好坏无从判断,换模型、改 prompt 都不敢动。它是 AI 的测试套件,也是最被低估的一类 |
| P0 | 知识 / 上下文资产 | 领域知识库、RAG 语料、项目背景、结构化事实 | 别人拿不到的领域知识决定 Agent 的上限。模型和 prompt 可替换,知识不可 |
| P1 | 能力资产 | 封装好的 skill、工具、MCP server | Agent 能做什么,复用价值最直观 |
| P1 | Agent 定义与编排 | 角色提示词、子 agent 定义、工作流 | Agent 怎么组合起来干活 |
| P2 | 记忆 / 轨迹数据 | 历史任务记录、人工纠正、反馈 | 单条没价值,攒起来是飞轮,同时喂养下一版 Eval 和知识库 |
| P3 | 提示词模板 | prompt 片段、few-shot 例子 | 单个价值最低、迭代最快,但极便宜,顺手沉淀即可 |
如果一个团队资源有限、只能先做两件事,那就是 Eval 和知识库。原因很直接:skill 和 agent 好不好用,得靠 Eval 来度量;agent 聪不聪明,得靠知识库来喂。评测集尤其反直觉------很多人以为评测就是攒一堆能通过的用例,但一个所有模型都能过、或者都过不了的用例,信息量为零。有价值的评测集,装的是那些能把好答案和坏答案区分开的用例。
二、沉淀不下来的第一层病因:分发方式拿错了
大部分团队复用起来费劲,是因为对所有资产都用了同一种笨办法------本地安装再手动组合。而资产其实分成截然不同的两类,得用两种完全不同的方式流转。
这是这篇文章最想给你的一个框架:先把资产分成"能装的"和"只能连的",再决定怎么分发。
| 能装的(无状态能力) | 只能连的(有状态 / 重资产) | |
|---|---|---|
| 典型例子 | skill、prompt、agent 定义、规则 | 连数据库或内网的工具、知识库、检索服务 |
| 正确的分发方式 | 安装:做成有版本的依赖,用包管理器拉 | 连接:部署成一份共享服务,远程调用 |
| 一键复用怎么做到 | 一条命令从 registry 拉取并自动同步 | 给一个地址加鉴权,本地什么都不用装 |
| 会不会分叉 | 会,需要单独治理(见第四节) | 天然不会,因为没有本地副本可以偏离 |
这个区分能直接解掉"东西都得在本地搭环境"的痛。**连数据库、连内网的工具,还有知识库,本来就不该让每个人在本地装一份。**它们应该是部署一次的共享服务,团队成员拿到一个接口地址就能用。全公司连同一个数据源的能力,跑一份就够了,没有理由人手一个本地脚本。
很多团队的卡点,就是把只能连的东西错当成要装的东西在处理。知识库尤其典型:与其让每个人在本地各拉一份语料、各建一次索引、然后各自过期,不如架一个共享的检索服务,所有 Agent 都去查同一个来源。反过来,无状态的 skill 和 prompt 因为轻、没有运行时状态,才适合当依赖装到本地。两类东西混用一种分发方式,是低效的根源。
三、跨团队:要联邦,而不是合并成一个大中心库
当团队里同时有前端、后端、客户端等多个小组,每个组都有自己的 skill 和知识库,协作会更麻烦一层。这里有个常见的错误冲动:把所有知识库合并成一个统一的大中心库。这条路基本走不通------各组的领域词汇、更新节奏、权责边界都不一样,硬合并的结果是谁都不满意,维护责任也糊成一团。
正确的思路是联邦,参考微服务和包管理的分治方式:
- 命名空间加所有权。每个组拥有自己的命名空间,像包管理里的 scope 一样(前端组一个前缀、后端组一个前缀)。谁拥有谁维护,出了问题找得到人。这一条是后面所有治理的地基。
- 统一发现层,而不是统一存储层。不要去合并各组的知识库,而是在它们上面架一层检索或路由:用户提问时,系统把问题分发到正确那个组的知识库,或者跨库混合检索。存储照旧分散在各组手里,只有入口是统一的。
- 组间能力靠接口调用,而不是复制代码。前端组要用后端组的某个能力,就去调后端组暴露出来的服务接口,不需要理解内部实现,也不需要把对方的代码抄一份到自己这边。这样一来,一个组的能力就成了全公司可复用的资产,而不是被复制出无数变体。
联邦的好处是各组保留自治,同时又能互相调用、共享发现。它承认了一个现实:跨团队协作的目标是让能力流动,不是让所有东西归到一处。
四、中心化资产为什么会越用越旧
最扎心的问题在这里:资产好不容易沉淀到中心了,大家复用之后又在本地各改各的,慢慢分叉;时间一长,中心那份反而落后于散落在各人电脑里的版本。
要治这个病,先得看清人为什么会在本地魔改而不推回中心。答案很朴素:**在本地随手改一刀的摩擦力,比把改动提交回中心的摩擦力更低。**人都是走阻力最小的路。所以治理的方向不是喊纪律,而是想办法翻转这个摩擦力的对比。
有四个可以下手的杠杆:
第一,把"回推"做得比"本地改"更省事。给资产配好自动分配的 reviewer、提交模板、自动化校验,让贡献回中心变成几分钟就能搞定且不会搞砸的事。当回推足够顺,人就不会把改动攒在本地。
第二,用配置和扩展点替代复制粘贴改源码。大部分分叉是因为"我只想改一点点"。如果资产本身提供参数、覆盖项、组合点,人们就会用配置来定制,而不是拷一份改一份。这跟用插件扩展软件、而不去改它源码是同一个道理。
第三,把重资产服务化,让分叉在物理上就变难。这一点前面讲过------工具和知识库做成共享服务,本地根本没有副本可供分叉,中心那份自然就是唯一来源。你没法像 fork 一个文件那样去 fork 一个服务。
第四,让分叉可见。别指望彻底消灭分叉,要让它浮出水面。追踪谁在跑改过的、过期的版本,把这种偏离主动暴露出来。看不见的分叉才是灾难,能被看见的分叉只是一条待处理的信息。
还有一个容易被忽略的前提:中心版本会落后,往往是因为它本身就是个没人管的死物。给它配上明确的负责人、自动化校验和评测,让中心那份永远是最好用的一版。只要复用中心比维护本地副本更省心,就没人愿意去维护自己的分叉了。所谓一处更新、处处生效,从来不是靠团队成员的自觉守出来的,是靠架构定死的------把资产做成有版本的依赖或远程服务,自动同步才会成为默认行为。
五、现成的开源拼图
这套框架落到工具上,业界已经有不少成熟的开源方案,可以按资产的层次对号入座,不必自己造轮子。这里作为一份地图列出来,供判断参考。
分发层解决"能装的资产怎么一键复用"。有的 Agent 工具自带插件市场机制,团队开一个共享仓库,成员一条命令就能装齐一整套 skill、子 agent、命令和工具配置,上游更新后本地自动同步,这就是那种装一次、处处更新的效果。也有跨工具的通用注册中心,把规则、prompt、模型配置、工具都做成可版本化、可订阅的条目。工具和能力这一层,还有专门的 MCP server 注册与分发生态,相当于 Agent 世界的应用市场。
知识联邦层解决多组知识库如何统一检索。有开源的企业搜索类项目能接入几十种数据源,提供统一的检索入口,还带权限控制和共享机制,正好对应前面说的"统一发现层"。
Prompt 和 Eval 这一层,有开源的 LLM 工程平台把 prompt 集中管理、版本控制、评测和可观测都做在一起,把 prompt 从代码里抽出来集中版本化,正好治 prompt 类资产的分叉;配合专门的评测框架,就能给核心资产建起回归和质量基线。
最后是治理层,容易被忽略但很关键。有些内部开发者门户项目虽然不是 AI 专用,但它那套"软件目录"的模型极有参考价值:每个资产用一个元数据文件放在自己的仓库里,被中心抓取汇总;每个条目强制有负责人;全公司的资产和归属都可被搜索到。把这套模型搬到 AI 资产上,就是联邦治理和防分叉的骨架。
这些拼图各自成熟,难点从来不在单个工具,而在于有没有先把资产分好类、划好权责,再让合适的工具各就各位。
关键结论
- AI 资产的门槛是三条:创建有成本、能跨人复用、随时间增值。团队资源有限时,先做 Eval 和知识库这两个 P0,其余都要靠它们来度量和喂养。
- 沉淀不下来的头号原因,是对所有资产用同一种分发方式。先分清"能装的"(做成依赖装到本地)和"只能连的"(部署成共享服务远程用),一键复用和防分叉会同时变简单。
- 多组协作要联邦而非合并:命名空间加所有权、统一发现层而非统一存储、组间靠接口调用而非复制代码。
- 中心资产越用越旧,根子在本地魔改的摩擦力低于回推。翻转它的四个杠杆是:回推更省事、配置替代改源码、服务化让分叉变难、漂移可见。
- 一处更新处处生效不靠自觉,靠架构。把资产做成有版本的依赖或远程服务,同步就成了默认行为,而不是需要有人时时提醒的纪律。