团队 AI 资产总烂在本地？先分清哪些该装、哪些只能连

导读

一个几乎每个团队都会遇到的场景：组里最好用的那个 skill、最全的领域知识库、最顺手的连数据库脚本，往往只活在某一个人的笔记本上。别人想用，得把环境在本地重装一遍、重新配一遍、再手动拼起来。更糟的是，装完之后每个人又在本地悄悄改了几刀，慢慢分叉成好几个互不相同的版本，而当初那个中心版本反而越来越旧、越来越没人维护。

私有资产沉淀不成团队资产，这是很多团队搭 Agent Team 时真正卡住的地方。模型可以随时换，prompt 可以重写，但一套攒不起来、流动不动的资产，会让整个团队的 AI 能力停留在"个人手艺"阶段。这篇文章不讲怎么一步步搭平台，而是给一套判断框架：先想清楚每一类资产该用什么方式分发，很多沉淀和复用的难题会自己消解掉。

一、先定义清楚：什么才算 AI 资产

"AI 资产"这个词很容易被泛化成所有跟 AI 沾边的东西。先立一个筛子。一个东西能被称作资产，要同时满足三条：创建它花了成本、它能跨人跨任务复用、它随时间积累会增值。只满足前一条的（比如某次一次性的 prompt 调试记录）是消耗品，不是资产。

按这个标准，团队里真正值得当资产经营的，是下面这几类：

优先级	资产类型	是什么	为什么这么排
P0	评测集 / Eval	golden 用例、回归集、打分标准、评测脚本	没有它，其他资产的好坏无从判断，换模型、改 prompt 都不敢动。它是 AI 的测试套件，也是最被低估的一类
P0	知识 / 上下文资产	领域知识库、RAG 语料、项目背景、结构化事实	别人拿不到的领域知识决定 Agent 的上限。模型和 prompt 可替换，知识不可
P1	能力资产	封装好的 skill、工具、MCP server	Agent 能做什么，复用价值最直观
P1	Agent 定义与编排	角色提示词、子 agent 定义、工作流	Agent 怎么组合起来干活
P2	记忆 / 轨迹数据	历史任务记录、人工纠正、反馈	单条没价值，攒起来是飞轮，同时喂养下一版 Eval 和知识库
P3	提示词模板	prompt 片段、few-shot 例子	单个价值最低、迭代最快，但极便宜，顺手沉淀即可

如果一个团队资源有限、只能先做两件事，那就是 Eval 和知识库。原因很直接：skill 和 agent 好不好用，得靠 Eval 来度量；agent 聪不聪明，得靠知识库来喂。评测集尤其反直觉------很多人以为评测就是攒一堆能通过的用例，但一个所有模型都能过、或者都过不了的用例，信息量为零。有价值的评测集，装的是那些能把好答案和坏答案区分开的用例。

二、沉淀不下来的第一层病因：分发方式拿错了

大部分团队复用起来费劲，是因为对所有资产都用了同一种笨办法------本地安装再手动组合。而资产其实分成截然不同的两类，得用两种完全不同的方式流转。

这是这篇文章最想给你的一个框架：先把资产分成"能装的"和"只能连的"，再决定怎么分发。

	能装的（无状态能力）	只能连的（有状态 / 重资产）
典型例子	skill、prompt、agent 定义、规则	连数据库或内网的工具、知识库、检索服务
正确的分发方式	安装：做成有版本的依赖，用包管理器拉	连接：部署成一份共享服务，远程调用
一键复用怎么做到	一条命令从 registry 拉取并自动同步	给一个地址加鉴权，本地什么都不用装
会不会分叉	会，需要单独治理（见第四节）	天然不会，因为没有本地副本可以偏离

这个区分能直接解掉"东西都得在本地搭环境"的痛。**连数据库、连内网的工具，还有知识库，本来就不该让每个人在本地装一份。**它们应该是部署一次的共享服务，团队成员拿到一个接口地址就能用。全公司连同一个数据源的能力，跑一份就够了，没有理由人手一个本地脚本。

很多团队的卡点，就是把只能连的东西错当成要装的东西在处理。知识库尤其典型：与其让每个人在本地各拉一份语料、各建一次索引、然后各自过期，不如架一个共享的检索服务，所有 Agent 都去查同一个来源。反过来，无状态的 skill 和 prompt 因为轻、没有运行时状态，才适合当依赖装到本地。两类东西混用一种分发方式，是低效的根源。

三、跨团队：要联邦，而不是合并成一个大中心库

当团队里同时有前端、后端、客户端等多个小组，每个组都有自己的 skill 和知识库，协作会更麻烦一层。这里有个常见的错误冲动：把所有知识库合并成一个统一的大中心库。这条路基本走不通------各组的领域词汇、更新节奏、权责边界都不一样，硬合并的结果是谁都不满意，维护责任也糊成一团。

正确的思路是联邦，参考微服务和包管理的分治方式：

命名空间加所有权。每个组拥有自己的命名空间，像包管理里的 scope 一样（前端组一个前缀、后端组一个前缀）。谁拥有谁维护，出了问题找得到人。这一条是后面所有治理的地基。
统一发现层，而不是统一存储层。不要去合并各组的知识库，而是在它们上面架一层检索或路由：用户提问时，系统把问题分发到正确那个组的知识库，或者跨库混合检索。存储照旧分散在各组手里，只有入口是统一的。
组间能力靠接口调用，而不是复制代码。前端组要用后端组的某个能力，就去调后端组暴露出来的服务接口，不需要理解内部实现，也不需要把对方的代码抄一份到自己这边。这样一来，一个组的能力就成了全公司可复用的资产，而不是被复制出无数变体。

联邦的好处是各组保留自治，同时又能互相调用、共享发现。它承认了一个现实：跨团队协作的目标是让能力流动，不是让所有东西归到一处。

四、中心化资产为什么会越用越旧

最扎心的问题在这里：资产好不容易沉淀到中心了，大家复用之后又在本地各改各的，慢慢分叉；时间一长，中心那份反而落后于散落在各人电脑里的版本。

要治这个病，先得看清人为什么会在本地魔改而不推回中心。答案很朴素：**在本地随手改一刀的摩擦力，比把改动提交回中心的摩擦力更低。**人都是走阻力最小的路。所以治理的方向不是喊纪律，而是想办法翻转这个摩擦力的对比。

有四个可以下手的杠杆：

第一，把"回推"做得比"本地改"更省事。给资产配好自动分配的 reviewer、提交模板、自动化校验，让贡献回中心变成几分钟就能搞定且不会搞砸的事。当回推足够顺，人就不会把改动攒在本地。

第二，用配置和扩展点替代复制粘贴改源码。大部分分叉是因为"我只想改一点点"。如果资产本身提供参数、覆盖项、组合点，人们就会用配置来定制，而不是拷一份改一份。这跟用插件扩展软件、而不去改它源码是同一个道理。

第三，把重资产服务化，让分叉在物理上就变难。这一点前面讲过------工具和知识库做成共享服务，本地根本没有副本可供分叉，中心那份自然就是唯一来源。你没法像 fork 一个文件那样去 fork 一个服务。

第四，让分叉可见。别指望彻底消灭分叉，要让它浮出水面。追踪谁在跑改过的、过期的版本，把这种偏离主动暴露出来。看不见的分叉才是灾难，能被看见的分叉只是一条待处理的信息。

还有一个容易被忽略的前提：中心版本会落后，往往是因为它本身就是个没人管的死物。给它配上明确的负责人、自动化校验和评测，让中心那份永远是最好用的一版。只要复用中心比维护本地副本更省心，就没人愿意去维护自己的分叉了。所谓一处更新、处处生效，从来不是靠团队成员的自觉守出来的，是靠架构定死的------把资产做成有版本的依赖或远程服务，自动同步才会成为默认行为。

五、现成的开源拼图

这套框架落到工具上，业界已经有不少成熟的开源方案，可以按资产的层次对号入座，不必自己造轮子。这里作为一份地图列出来，供判断参考。

分发层解决"能装的资产怎么一键复用"。有的 Agent 工具自带插件市场机制，团队开一个共享仓库，成员一条命令就能装齐一整套 skill、子 agent、命令和工具配置，上游更新后本地自动同步，这就是那种装一次、处处更新的效果。也有跨工具的通用注册中心，把规则、prompt、模型配置、工具都做成可版本化、可订阅的条目。工具和能力这一层，还有专门的 MCP server 注册与分发生态，相当于 Agent 世界的应用市场。

知识联邦层解决多组知识库如何统一检索。有开源的企业搜索类项目能接入几十种数据源，提供统一的检索入口，还带权限控制和共享机制，正好对应前面说的"统一发现层"。

Prompt 和 Eval 这一层，有开源的 LLM 工程平台把 prompt 集中管理、版本控制、评测和可观测都做在一起，把 prompt 从代码里抽出来集中版本化，正好治 prompt 类资产的分叉；配合专门的评测框架，就能给核心资产建起回归和质量基线。

最后是治理层，容易被忽略但很关键。有些内部开发者门户项目虽然不是 AI 专用，但它那套"软件目录"的模型极有参考价值：每个资产用一个元数据文件放在自己的仓库里，被中心抓取汇总；每个条目强制有负责人；全公司的资产和归属都可被搜索到。把这套模型搬到 AI 资产上，就是联邦治理和防分叉的骨架。

这些拼图各自成熟，难点从来不在单个工具，而在于有没有先把资产分好类、划好权责，再让合适的工具各就各位。

关键结论

AI 资产的门槛是三条：创建有成本、能跨人复用、随时间增值。团队资源有限时，先做 Eval 和知识库这两个 P0，其余都要靠它们来度量和喂养。
沉淀不下来的头号原因，是对所有资产用同一种分发方式。先分清"能装的"（做成依赖装到本地）和"只能连的"（部署成共享服务远程用），一键复用和防分叉会同时变简单。
多组协作要联邦而非合并：命名空间加所有权、统一发现层而非统一存储、组间靠接口调用而非复制代码。
中心资产越用越旧，根子在本地魔改的摩擦力低于回推。翻转它的四个杠杆是：回推更省事、配置替代改源码、服务化让分叉变难、漂移可见。
一处更新处处生效不靠自觉，靠架构。把资产做成有版本的依赖或远程服务，同步就成了默认行为，而不是需要有人时时提醒的纪律。