大模型应用开发 11.Agent Skills

过去的早就该在生命里原谅了,

我不是那样歇斯底里的人;

------ 26.5.26

一、什么是Agent Skills

Skill = 技能,一般包含:流程规则、经验配方、所需工具、其他材料

1.Agent Skill 目录结构

Skills就是我们给AI Agent的一个"说明书"与"工具箱",定义与封装任务逻辑,让AI表现更卓越。

**特点:**模块化封装(可复用的能力单元)、可靠性(任务处理稳健可控)、一致性(输出结果标准统一)


二、如何使用Skills

1.安装Agent

首先,在设备上下载并安装核心Agent程序,它是运行所有Skill的基础环境

**opencode:**是一款开源AI Agent,内置免费模型,或连接任意提供商的任意模型, 包括 Claude, GPT, Gemini 等。

Mac 用户直接使用 curl 安装

复制代码
curl -fsSL https://opencode.ai/install | bash

Windows 用户推荐使用npm 安装,但先需要安装node.js,如果没有node.js环境,请下载安装

node.js下载链接: https://nodejs.org/en/download
下载opencode: https://opencode.ai/

复制代码
npm i -g opencode-ai

输入opencode命令启动

复制代码
opencode

⭐2.使用Agent

① 选择使用的模型:/models

② 链接模型提供商:/connect

③ 输入对应模型提供商的API KEY

3.下载 Skill

从社区或者相关站点、仓库中下载 Skill,然后集成到Agent中

**anthropic官方仓库:**https://github.com/anthropics/skills

**Skills社群网站:**https://skillsmp.com/zh

**优秀开源集合:**https://github.com/ComposioHQ/awesome-claude-skills

**精选skills库:**https://github.com/\]ackyST0/awesome-agent-skills

**视频制作skill:**https://github.com/remotion-dev/skills

**youtube视频剪辑skill:**https://github.com/op7418/Youtube-clipper-skill

**大师帮你创建skill的skill:**https://github.com/GBsOSS/skill-from-masters

**notebookLM skill:**https://github.com/PleasePrompto/notebooklm-skill

**markdown发布到X skill:**https://github.com/wshuyi/x-article-publisher-skill

**AI 视频产品 Vidu Skills:**https://www.vidu.cn/

**agent-skills.md包含 6000 多个好用的实用技能:**https://agent-skills.md

**Skillstore:**https://skillstore.io/zh-hans

**Reddit 社区推荐的技能合集:**https://www.skillsdirectory.com/

**agentskills.me:**https://agentskills.me/

**Vercel 官方仓库:**https://github.com/vercel-labs/agent-skills

**开发者 Antfu 维护的技能库:**https://github.com/antfu/skills

**skill收藏库:**https://github.com/ZhanlinCui/Ultimate-Agent-Skills-Collection

**skillsbot:**https://www.skillsbot.cn/

⭐4.使用 Skill

通过指令或界面唤起已安装的 Skill,即可享受高效、职能的自动化办公与学习体验

将Skill提供给Agent,让Agent找到Skill的路径

1.在项目文件夹下面,创建一个.opencode的文件夹

2.在.opencode文件夹下面再创建一个skills文件夹

3.然后把下载好的这些skill放到skills文件夹中

4.在项目文件夹下创建一个opencode的对话窗口,opencode就能够加载到当前项目下的skill


三、如何会创造自己的Skills

官方文档: https://agentskills.io/specification(可翻译)

官方电子书: https://resources.anthropic.com/hubfs/The-Complete-Guide-to-Building-Skill-for-Claude.pdf?hsLang=en

Skill示例:

复制代码
---
name: pptx
description: "只要任务涉及任意 .pptx 文件(作为输入、输出或二者兼具),就使用本技能。适用场景包括:制作幻灯片、路演演示文稿;读取、解析、提取任意 .pptx 文件中的文本(即便提取内容将用于邮件、总结等其他场景);编辑、修改、更新现有演示文稿;合并/拆分幻灯片文件;处理模板、版式、演讲者备注或批注。只要用户提及「演示文稿」「幻灯片」「PPT」或 .pptx 文件名,无论后续如何使用内容,均触发本技能。若需要打开、创建或修改 .pptx 文件,请使用本技能。"
license: 专有软件。完整条款见 LICENSE.txt

---

# PPTX 技能

## 快速参考

| 任务                 | 操作指引                                   |
| -------------------- | ------------------------------------------ |
| 读取/分析内容        | `python -m markitdown presentation.pptx`   |
| 基于模板编辑或创建   | 阅读 [editing.md](editing.md)              |
| 从零创建演示文稿     | 阅读 [pptxgenjs.md](pptxgenjs.md)          |

---

## 读取内容

```bash
# 提取文本
python -m markitdown presentation.pptx

# 可视化概览
python scripts/thumbnail.py presentation.pptx

# 导出原始XML结构
python scripts/office/unpack.py presentation.pptx unpacked/
```

---

## 编辑流程

**完整细节请阅读 [editing.md](editing.md)。**

1. 使用 `thumbnail.py` 分析模板
2. 解压 → 调整幻灯片 → 编辑内容 → 清理冗余 → 重新打包

---

## 从零创建演示文稿

**完整细节请阅读 [pptxgenjs.md](pptxgenjs.md)。**
无可用模板或参考演示文稿时使用本方式。

---

## 设计思路

**不要制作平庸的幻灯片。**白底纯项目符号的版式毫无吸引力,请为每张幻灯片参考以下设计思路。

### 开始制作前

- **选取贴合主题的鲜明配色方案**:配色必须适配本次演示主题。若该配色套用到其他完全无关的演示文稿中仍适配,说明配色针对性不足。
- **主次分明,拒绝均等**:主色调占视觉比重60%‑70%,搭配1‑2个辅助色与1个醒目的强调色,禁止所有颜色权重均等。
- **明暗对比**:标题页、结尾页使用深色背景,正文页使用浅色背景(三明治结构);或全程使用深色风格,营造高级质感。
- **固定视觉主题元素**:选定**一种**特色元素贯穿所有幻灯片,如圆角图片框、彩色圆形图标、单侧粗边框等。

### 配色方案

配色需贴合主题,禁止默认使用通用蓝色,以下方案可作为参考:

| 主题           | 主色                  | 辅助色                | 强调色                |
| -------------- | --------------------- | --------------------- | --------------------- |
| **午夜商务风** | `1E2761`(藏青)      | `CADCFC`(冰蓝)      | `FFFFFF`(纯白)      |
| **森林苔藓风** | `2C5F2D`(森林绿)    | `97BC62`(苔藓绿)    | `F5F5F5`(米白)      |
| **珊瑚活力风** | `F96167`(珊瑚红)    | `F9E795`(浅金)      | `2F3C7E`(藏青)      |
| **暖陶土风**   | `B85042`(陶土红)    | `E7E8D1`(沙色)      | `A7BEAE`(鼠尾草绿)  |
| **海洋渐变风** | `065A82`(深海蓝)    | `1C7293`(青蓝)      | `21295C`(午夜蓝)    |
| **炭灰极简风** | `36454F`(炭灰)      | `F2F2F2`(米白)      | `212121`(纯黑)      |
| **青蓝信赖风** | `028090`(青蓝)      | `00A896`(海沫绿)    | `02C39A`(薄荷绿)    |
| **浆果奶油风** | `6D2E46`(浆果紫)    | `A26769`(豆沙玫瑰)  | `ECE2D0`(奶油色)    |
| **鼠尾草静谧风**| `84B59F`(鼠尾草绿)  | `69A297`(尤加利绿)  | `50808E`(石板灰)    |
| **樱桃醒目风** | `990011`(樱桃红)    | `FCF6F5`(米白)      | `2F3C7E`(藏青)      |

### 单张幻灯片设计要点

**每张幻灯片必须包含视觉元素**:图片、图表、图标或形状,纯文本幻灯片缺乏记忆点。

**版式可选方案**:
- 双栏布局(左侧文字、右侧配图)
- 图标+文字行(彩色圆形图标、加粗标题、下方描述)
- 2×2 / 2×3网格(一侧配图,另一侧为内容模块网格)
- 半出血大图(左侧或右侧通栏大图)叠加文字内容

**数据展示方式**:
- 大号数据突出展示(60‑72pt大数字,下方配小号说明标签)
- 对比栏(前后对比、优缺点、多方案并列)
- 时间线/流程示意图(编号步骤+箭头)

**视觉优化细节**:
- 章节标题旁添加小尺寸彩色圆形图标
- 关键数据、标语使用斜体强调文本

### 字体排版

**选用有设计感的字体组合**,禁止默认使用Arial。搭配一款有风格的标题字体与简洁的正文字体。

| 标题字体    | 正文字体      |
| ----------- | ------------- |
| Georgia     | Calibri       |
| Arial Black | Arial         |
| Calibri     | Calibri Light |
| Cambria     | Calibri       |
| Trebuchet MS| Calibri       |
| Impact      | Arial         |
| Palatino    | Garamond      |
| Consolas    | Calibri       |

| 元素         | 字号          |
| ------------ | ------------- |
| 幻灯片标题   | 36‑44pt 加粗  |
| 章节标题     | 20‑24pt 加粗  |
| 正文文本     | 14‑16pt       |
| 说明注释     | 10‑12pt 淡色  |

### 间距规范
- 页边距最小0.5英寸
- 内容模块间距0.3‑0.5英寸
- 预留留白空间,不要填满整个页面

### 常见错误(务必规避)
- **版式不要重复**:跨幻灯片交替使用分栏、卡片、重点突出等版式
- **正文文本禁止居中**:段落、列表左对齐,仅标题居中
- **字号对比不要过小**:标题需36pt以上,与14‑16pt正文形成明显层级
- **不要默认使用蓝色**:配色需贴合具体演示主题
- **间距不要混乱**:固定使用0.3英寸或0.5英寸间距,全程统一
- **不要单张精致、其余简陋**:要么全程统一精致风格,要么全程极简
- **禁止纯文本幻灯片**:添加图片、图标、图表等视觉元素,避免仅标题+项目符号
- **文本框注意内边距**:对齐线条、形状与文字边缘时,将文本框内边距设为0,或偏移形状补偿内边距
- **元素对比度要充足**:图标、文字需与背景形成强烈对比,禁止浅字配浅底、深字配深底
- **标题下方禁止使用装饰线**:这是AI生成幻灯片的典型特征,改用留白或背景色块替代

---

## 质量校验(必须执行)

**默认存在问题,你的工作是找出问题。**

首次生成的幻灯片几乎不可能完全正确,校验应视为**漏洞排查**,而非确认检查。若初次检查未发现任何问题,说明检查不够细致。

### 内容校验

```bash
python -m markitdown output.pptx
```
检查内容缺失、错别字、顺序错误。

**使用模板时,排查残留占位文本:**

```bash
python -m markitdown output.pptx | grep -iE "xxxx|lorem|ipsum|本页.*版式"
```
若检索到结果,必须修复后再确认完成。

### 视觉校验

**⚠️ 必须调用子代理检查**------即便仅2‑3张幻灯片。开发者长期查看代码,易产生视觉盲区,子代理可提供客观视角。

将幻灯片转为图片(参考[转为图片](#转为图片)),使用以下提示词校验:

```
可视化检查以下幻灯片,默认存在问题,请逐一排查。

重点检查:
- 元素重叠(文字压形状、线条压文字、元素堆叠遮挡)
- 文本溢出/边缘截断
- 单行文本装饰线适配双行标题
- 页脚引用/备注与上方内容冲突
- 元素间距过近(小于0.3英寸)、模块几乎贴合
- 间距不均(局部留白过大、局部内容拥挤)
- 幻灯片边缘边距不足(小于0.5英寸)
- 分栏/同类元素对齐不统一
- 文字对比度不足(如浅灰文字配米黄色背景)
- 图标对比度不足(深色图标配深色背景,无对比圆形衬托)
- 文本框过窄导致文字过度换行
- 残留占位内容

为每张幻灯片列出问题或潜在隐患,微小问题也需标注。

读取并分析以下图片:
1. /path/to/slide-01.jpg(预期效果:[简要描述])
2. /path/to/slide-02.jpg(预期效果:[简要描述])

列出所有发现的问题,包括微小瑕疵。
```

### 校验闭环流程
1. 生成幻灯片 → 转为图片 → 视觉检查
2. **列出所有问题**(若无问题,重新细致检查)
3. 修复问题
4. **复核受影响幻灯片**(一处修复常引发新问题)
5. 重复操作直至无新增问题

**必须完成至少一轮修复‑复核循环,方可确认完成。**

---

## 转为图片

将演示文稿批量转为单张幻灯片图片,用于视觉校验:

```bash
python scripts/office/soffice.py --headless --convert-to pdf output.pptx
pdftoppm -jpeg -r 150 output.pdf slide
```
执行后生成 `slide-01.jpg`、`slide-02.jpg` 等图片。

修复后仅重新渲染指定幻灯片:
```bash
pdftoppm -jpeg -r 150 -f N -l N output.pdf slide-fixed
```

---

## 依赖库
- `pip install "markitdown[pptx]"` --- 文本提取
- `pip install Pillow` --- 缩略图网格生成
- `npm install -g pptxgenjs` --- 从零创建演示文稿
- LibreOffice(`soffice`)--- PDF转换(沙盒环境通过 `scripts/office/soffice.py` 自动配置)
- Poppler(`pdftoppm`)--- PDF转图片

四、什么场景下适合用Skills

1.无需上Skills(适合人工处理)

**随机聊天:**情感倾诉、闲聊、段子

**一次性文案:**临时活动文案、即兴发言

**高创造性内容:**小说、创意广告,特点 - 结构太散

2.可以上Skills(适合自动化/标准化)

**SOP执行型:**制造业(设备巡检,质量检查)、运营(活动复盘,数据分析);特点 - 固定流程,高重复

**知识密集型:**培训(新员工手册,制度问答)、HR(薪酬政策,考勤规则);特点 - 文档多,更新慢

**复合型工作流:**电商(选品->定价->文案->投放)、市场(调研->策划->执行->复盘);特点 - 多步骤

**模板生成型:**咨询(调研报告,诊断报告)、政企(申报材料);特点 - 框架固定

**风控合规型:**法务(合同审查、风险提示)、医疗管理(流程审批);特点:错不起


五、用好Skills,Agent同样重要

1.Agent Skill 渐进式披露

元数据给到模型 ------> 确定使用某个Skill ------> 加载该Skill所需上下文

2.其余Agent

**Claude Code:**命令行输入 - npm install -g @anthropic-ai/claude-code

WorkBuddy: https://www.codebuddy.cn/

Qorder: https://qoder.com/

Trae: https://www.trae.cn/

相关推荐
深兰科技26 分钟前
韩国KAIST AI半导体高管项目代表团到访深兰科技,聚焦AI算力与智能产业合作机会
人工智能·机器人·symfony·ai算力·深兰科技·韩国科学技术院·kaist
快乐on9仔32 分钟前
NLP学习(一)transformers之pipeline体验
人工智能·深度学习
冬奇Lab1 小时前
Agent系列(六):记忆管理——让 Agent 记住重要的事
人工智能·agent
冬奇Lab1 小时前
一天一个开源项目(第113篇):notebooklm-py - 把 Google NotebookLM 变成可编程 API,还能接入 Claude Code
人工智能·google·开源
字节跳动开源2 小时前
Viking AI 搜索 CLI 正式发布:会说话,就能做搜索推荐
数据库·人工智能·开源
阿杰技术2 小时前
AI 编程助手落地实战:从提效到重构的全场景指南
人工智能·重构
Agent手记2 小时前
制造业生产流程自动化,Agent需要具备哪些能力?深度拆解2026工业级智能体落地范式与核心架构
大数据·人工智能·ai·架构·自动化
道里2 小时前
花了 5 万刀用 AI 写代码之后,这是我的全部经验
前端·人工智能
硅基流动2 小时前
光谷爱计算 × 硅基流动:AI 算力联合运营,共建高效“Token 工厂”
大数据·人工智能