从0开发大模型之实现Agent(Bash到SKILL)
最近在搞大模型Agent开发,发现一个很有意思的现象------越简单,反而越强大!🤯 今天就跟大家摆摆这个龙门阵,从最基础的Bash工具讲到进阶的Skills架构,看看怎么把一个"莽子"Agent训练成"精明"助手。
🔗 Claude Code 国内代理链接 ------ 通过此链接注册使用,可以送20美金抵扣券直接可用! 真的巴适得板,搞AI开发必备神器!

一、Agent的"莽子时代":从一堆工具说起
刚开始搞Agent的时候,我也跟大多数人一样,觉得"工具越多越好"。恨不得把所有能想到的功能都封装成工具:
- schema_lookup(查找数据库模式)
- query_validation(查询验证)
- error_recovery(错误恢复)
- context_manager(上下文管理)
- intent_classifier(意图分类)
- ...还有一堆七八糟的
结果呢?代码写了一大堆,Agent反而越来越"憨":
import { GetEntityJoins, LoadCatalog, RecallContext,
LoadEntityDetails, SearchCatalog, ClarifyIntent,
SearchSchema, GenerateAnalysisPlan, /*...*/ } from '@/lib/tools'
const agent = new ToolLoopAgent({
model: "anthropic/claude-opus-4.5",
tools: {
GetEntityJoins, LoadCatalog, RecallContext, LoadEntityDetails,
SearchCatalog, ClarifyIntent, SearchSchema, GenerateAnalysisPlan,
FinalizeQueryPlan, FinalizeNoData, JoinPathFinder, SyntaxValidator,
FinalizeBuild, ExecuteSQL, FormatResults, VisualizeData, ExplainResults
}
})
十几个工具,看得脑壳痛!而且每次模型更新,还得重新调参调约束,维护成本高得吓人。😫
二、觉醒时刻:Vercel的"断舍离"大法
就在我觉得"这就是命"的时候,刷到了Vercel的技术博客------他们直接干掉了80%的工具!🎯

他们的数据对比太震撼了:
| 指标 | 复杂工具版 | 文件系统版 | 变化 |
|---|---|---|---|
| 平均执行时间 | 274.8秒 | 77.4秒 | 快3.5倍 ⚡ |
| 成功率 | 80% | 100% | +20% ✅ |
| 平均Token消耗 | ~102k | ~61k | 省37% 💰 |
| 平均步骤 | ~12步 | ~7步 | 少42% 📉 |
核心思路就是:给Claude一个Bash沙箱,让它自己想办法
javascript
const sandbox = await Sandbox.create()
await sandbox.writeFiles(files)
const agent = new ToolLoopAgent({
model: "anthropic/claude-opus-4.5",
tools: {
ExecuteCommand: executeCommandTool(sandbox), // 就这一个工具!
ExecuteSQL // 唯一的专用工具
}
})
Claude会自己用grep、cat、ls这些Unix命令去探索文件系统,就像一个真正的程序员一样!
为什么会这样?
- 我们低估了模型能力:Claude Opus 4.5聪明得很,不需要我们"喂饭"
- Unix工具已经够用了:grep 50年了还在用,说明它设计得好
- 约束反而成了桎梏:我们给的工具越多,模型反而越不知道该用哪个
Vercel的工程师说得好:"Don't fight gravity"(别跟地心引力过不去),简单才是王道!🎯
三、进阶之路:从Bash到Skills架构
虽然Bash Agent很强,但也不是万能的。有些复杂任务(比如生成PPT、处理Excel),还是需要专门的"技能包"。这时候,Agent Skills架构就派上用场了!

什么是Skills?
Skills就是把能力封装成可重用模块,Claude按需加载。就像给AI装插件一样,需要什么技能就调用什么:
- pptx:自动生成PowerPoint演示文稿
- xlsx:处理Excel表格、数据分析
- docx:生成Word文档
- pdf:提取PDF内容、填写表单
三层渐进加载:懒加载的艺术
Skills的设计精髓在于三级触发机制,避免浪费token:
+-------------------------+
| Metadata | ← 启动时加载:技能名称+描述(~100 tokens)
+-------------------------+
| Instructions | ← 匹配时加载:使用说明(<5k tokens)
+-------------------------+
| Resources | ← 执行时加载:脚本、模板、数据
+-------------------------+
Level 1: 元数据层
yaml
name: "PPT Generator"
description: "Creates PowerPoint presentations based on user descriptions."
Level 2: 指令层
markdown
# PPT生成指南
## Step 1: 分析用户需求
- 识别主题、页数、风格
## Step 2: 使用模板
- 调用 scripts/create_slides.py
- 填充内容到 templates/
Level 3: 资源层
- Python脚本
- PowerPoint模板
- 示例文件
这样设计的好处是按需加载,Claude启动时只扫一眼技能列表,真要用的时候才详细读取指令和资源。💡
四、实战演练:5分钟生成专业PPT
光说不练假把式,我们来看个实际例子:
场景:老板让你马上出个AI趋势报告PPT
传统方式:
- 自己写内容(1小时)
- 找模板(30分钟)
- 调整格式(1小时)
总计:2.5小时 😭
Skills方式:
python
import anthropic
client = anthropic.Anthropic()
response = client.beta.messages.create(
model="claude-sonnet-4.5",
betas=["skills-2025-10-02", "code-execution-2025-08-25"],
container={
"skills": [{"type": "anthropic", "skill_id": "pptx"}]
},
messages=[{
"role": "user",
"content": "创建一个5页的AI伦理报告PPT,包括引言、风险分析和解决方案"
}],
tools=[{"type": "code_execution_20250825", "name": "code_execution"}]
)
# 下载生成的PPT
file_id = response.content[0].file_id
file_content = client.beta.files.download(file_id=file_id)
with open("ai_ethics_report.pptx", "wb") as f:
file_content.write_to_file(f.name)
结果:30秒搞定!而且格式专业、逻辑清晰 🎉
五、架构演进路径总结
从零开发Agent,推荐这条路径:
阶段1️⃣:Bash Agent(起步)
- 只给执行Bash的权限
- 让模型自己探索
- 适用场景:代码分析、文件操作
阶段2️⃣:Tool Agent(优化)
- 保留通用工具(Bash、文件系统)
- 添加1-2个核心专用工具
- 适用场景:有特定业务逻辑的任务
阶段3️⃣:Skills Agent(扩展)
- 封装可复用技能包
- 模块化管理能力
- 适用场景:复杂工作流、多任务组合
关键原则:
- 从简单开始:别一上来就搞复杂架构
- 信任模型能力:Claude Opus 4.5比你想象的聪明
- 渐进式复杂化:证明有必要再添加功能
- 投资基础建设:好的文档/代码结构比花哨工具重要
六、踩坑指南 & 最佳实践
❌ 常见错误:
- 过度设计:还没跑起来就想支持所有场景
- 不信任模型:总觉得需要给详细指令
- 忽视基础:代码/文档乱七八糟,靠工具来弥补
✅ 正确姿势:
- 元数据精炼:name用动名词,description说清楚"做什么"和"何时用"
- 指令简洁:SKILL.md <500行,只写必要指导
- 资源组织:脚本放scripts/,模板放templates/
- 测试迭代:用不同模型测试,观察Claude如何导航文件
七、未来展望:AI技能生态
想象一下,未来可能有这样的场景:
你对Claude说:"帮我分析上周的销售数据,生成Excel图表,然后做成PPT发给老板"
Claude会自动:
- 调用xlsx技能读取数据
- 调用analytics技能进行分析
- 调用pptx技能生成演示文稿
- 调用email技能发送邮件
就像一个"具备技能目录的智能操作系统" 🚀
八、总结
从Bash到Skills,Agent架构的演进告诉我们一个道理:
最好的架构,是几乎不需要架构
- Vercel干掉80%工具,性能反而提升3.5倍
- Claude用grep、cat就能搞定复杂查询
- Skills按需加载,避免资源浪费
核心思想就是:相信AI的能力,给它自由,它会给你惊喜!💪
如果你也在搞Agent开发,强烈推荐从简单的Bash Agent开始,逐步演化到Skills架构。别一上来就想搞个大新闻,先让Agent跑起来,再慢慢优化。
最后,别忘了**Claude Code 国内代理链接**,注册就送20美金抵扣券,搞AI开发的兄弟们赶紧上车!🎁
参考资料:
- We removed 80% of our agent's tools - Vercel
- Claude Agent Skills 完整指南
- How to build agents with filesystems and bash - Vercel
- Agent Skills 终极指南:入门、精通、预测
代码示例仓库:
本文技术栈:Claude Opus 4.5 + Agent Skills + Vercel AI SDK + Python
作者:一个爱用四川话写技术博客的AI工程师 🤖