用嘴做设计?这个 Claude Code Skill 让我的 Figma 吃灰了

「打字。回车。一份能交付的设计。」

我第一次看到这句话,内心 OS 是:好家伙,AI 吹牛的姿势越来越文艺了。

然后我装上去试了一下。

我错了。我道歉。


背景:设计这件事,程序员的永恒噩梦

你有没有过这种经历:

产品需要一个 App 原型,你打开 Figma,调了半小时字体,发现自己还停在空白画布上。设计师 deadline 卡在下周,你急得像热锅上的蚂蚁,最后只能 PowerPoint 拉个方块交差,被设计师看了一眼说「嗯,有内味了」(她的语气让你怀疑她在安慰一个幼儿园小朋友)。

或者更惨的情况:你自己就是那个「全栈」------产品、设计、开发全包,一个人扛着三顶帽子在原地旋转。Figma 的曲线钢笔工具让你恐惧,Canva 的模板让你尴尬,最后做出来的东西只能形容为「AI Slop 的工业产物」------紫色渐变 + emoji 图标 + 左 border accent,一眼就能认出是 AI 生成的,就好像在你脸上贴了个「外行」的标签。

huashu-design 这个开源 skill 就是冲着这个痛点来的。


它是什么?

GitHub 地址github.com/alchaincyf/...

一句话说清楚:一个装进 Claude Code 的设计能力包,让你用说话的方式做出高保真的设计交付物。

安装只要一行命令:

bash 复制代码
npx skills add alchaincyf/huashu-design

然后在 Claude Code 里跟它说话:

objectivec 复制代码
「做一份 AI 心理学的演讲 PPT,推荐 3 个风格方向让我选」
「做个 AI 番茄钟 iOS 原型,4 个核心屏幕要真能点击」
「把这段逻辑做成 60 秒动画,导出 MP4 和 GIF」
「帮我对这个设计做一个 5 维度评审」

没有 GUI,没有拖拽面板,没有让你调贝塞尔曲线的工具------就是说话

作者花生(花叔)在 README 里写了一句话我特别喜欢:「对不愿意打开任何图形界面的人,80 分的 skill 比 100 分的产品好用。」

诚实到令人感动。


能做什么?我来帮你翻译一下

你想要的 huashu-design 交付的 大概等多久
App 长什么样? 带真 iPhone 15 Pro 机身边框的可点击 HTML 原型 10--15 分钟
下周要讲 PPT 浏览器里可演讲的 HTML deck,同时导出真文本框可编辑的 PPTX 15--25 分钟
需要一段宣传动画 带 BGM、60fps 插帧的 MP4,还有优化过的 GIF 8--12 分钟
不知道设计风格选哪个 从 5 流派 × 20 种设计哲学里推荐 3 个差异化方向,并行生成 Demo 让你选 5 分钟
想知道这个设计哪里烂 5 维度雷达图 + Keep/Fix/Quick Wins 可操作清单 3 分钟

值得单独拎出来说的是那个 PPTX 导出:它不是截图贴图片,而是真的用 html2pptx.js 读取 DOM 的 computedStyle,逐元素翻译成 PowerPoint 对象------也就是说,导出后你在 PowerPoint 里还能改文字位置。这种「不偷懒」的做法让我肃然起敬。


核心机制:它为什么不会做出那种「一眼 AI」的东西?

这里有几个设计决策很有意思。

1. 反 AI Slop 规则

README 里明确写了要避免的视觉「大公约数」:

  • ❌ 紫色渐变
  • ❌ emoji 当图标
  • ❌ 圆角 + 左 border accent 的 info 卡片
  • ❌ AI 用 SVG 画人脸(你懂那种诡异感)
  • ❌ 永远是 Inter 字体

转而使用 text-wrap: pretty、CSS Grid、精心挑选的 serif display 字体和 oklch 色彩空间。这些细节的堆积,就是「设计感」和「AI 味」的分水岭。

2. 品牌资产协议(最硬的规则)

涉及到具体品牌(比如 Stripe、Linear、或者你自家公司)时,它不会「凭记忆猜颜色」,而是强制走一个五步流程:问 → 搜官方品牌页 → 下载资产 → 用 grep 提取色值 → 固化成 CSS 变量

作者做了 A/B 测试(v1 vs v2,各跑 6 个 agent),v2 的稳定性方差比 v1 低了 5 倍。也就是说,加了这个协议之后,出来的结果一致性大幅提高。

3. Junior Designer 工作流

不会闷头做完再 show 你,而是:

  1. 先发问题清单等你批量答完
  2. 先写 assumptions + placeholders,尽早给你看(哪怕只是灰色方块)
  3. 填充内容 → 变体 → Tweaks 参数调整,分三次给你看
  4. 交付前 Playwright 自动跑浏览器验证一遍

理解错了早改比晚改便宜 100 倍------这句话每个做过大型需求的人都懂。


仓库结构:藏着不少宝贝

bash 复制代码
huashu-design/
├── SKILL.md              # 给 agent 读的主文档
├── assets/               # 预制组件
│   ├── animations.jsx    # Stage + Sprite + Easing 动画引擎
│   ├── ios_frame.jsx     # iPhone 15 Pro 精确机身
│   ├── showcases/        # 24 个预制样例(8 场景 × 3 风格)
│   └── bgm-*.mp3         # 6 首场景化背景音乐(!)
├── references/           # 子文档:20 种设计哲学详细库等
└── scripts/              # 导出工具链:HTML → MP4 → 60fps → GIF → MP4+BGM

6 首场景化背景音乐这个细节......我盯着看了三秒。做个动画顺便配上 BGM,这个工具的「交付」定义比我想象的要完整得多。


和 Claude Design 的关系:开源文化的新姿势

花叔在 README 里大方承认了:品牌资产协议的哲学是从 Claude Design 社区流传的系统提示词里「偷师」的,然后蒸馏成结构化 spec,写成 skill 装进了 Claude Code。

他把这件事叫做「基于其他产品灵感的二次创作,是开源文化在 AI 时代的新形态」。

我觉得这句话说得挺准的。Skill 工程师是新时代的「蒸馏者」------把别人产品里最有价值的认知提炼出来,变成可复用、可分发的能力包。这件事本身比写代码更需要品位。

两个产品的定位差异也很清晰:

Claude Design huashu-design
形态 网页产品 Claude Code Skill
操作方式 GUI(点、拖、改) 对话(说话,等 agent 跑完)
交付物 画布 + 可导 Figma HTML / MP4 / GIF / 可编辑 PPTX
跨 agent 专属 Claude.ai 任意 skill 兼容 agent

Claude Design 是「更好的图形工具」,huashu-design 是「让图形工具这层消失」。两条路,不同受众,不是竞争,是互补。


局限性(作者自己说的,我来转述)

  • 不支持图层级可编辑的 PPTX 到 Figma 导入
  • 不支持 Framer Motion 级别的 3D / 粒子动画
  • 完全空白的品牌从零设计,质量可能只有 60--65 分

这是一个 80 分的 skill,不是 100 分的产品。

我反而因为这段话更信任它了------能对自己的产品边界说清楚的人,通常对核心能力也做得靠谱。


怎么安装

前置条件:需要有 Claude Code 环境。

bash 复制代码
# 一行安装
npx skills add alchaincyf/huashu-design

# 然后在 Claude Code 里直接说话
# 例如:「做一个 AI 写作工具的 iOS App 原型,风格简洁,4 个核心屏幕」

跨 agent 通用,Claude Code、Cursor、Codex 都能装。


最后说一句

这个 skill 让我想起一句话:最好的工具是让你忘记工具存在的那种。

Figma 很强大,但我每次打开都先在工具栏迷失五分钟。huashu-design 的目标是让设计这件事退到背景里去------你只需要想清楚「我要什么」,剩下的交给 agent。

当然,它没法替代专业设计师。但对于「需要设计,但没有设计师」的独立开发者、全栈工程师、产品经理来说,这大概是目前最接近「用说话做设计」的开源方案之一

去 star 一下吧:github.com/alchaincyf/...

你的 Figma 也许不会吃灰,但至少多了一个新选项。


作者花叔(花生)是 AI Native Coder、独立开发者,代表作包括小猫补光灯(AppStore 付费榜 Top 1)和女娲 .skill(GitHub 12000+ Star)。商用授权联系:@AlchainHust(X / Twitter)。

相关推荐
Mininglamp_27182 小时前
Vibe Coding 之后是 Vibe Operating?
后端·开源·多智能体·ai agent·mano-p
幽络源小助理3 小时前
苹果CMS觅知ART弹幕播放器_MizhiPlayer全新UI-幽络源源码网
开源·源码·php源码
王木风4 小时前
Spring Boot + LLM 工程化:把短视频流水线拆成 16 个独立角色的踩坑记录
人工智能·spring boot·后端·开源·新媒体运营·音视频·agent
格兰芬多呼神护卫6 小时前
中国电信 TeleAI 开源 KungfuBot / PBHC 框架分析笔记
笔记·开源
DO_Community7 小时前
百亿参数开源模型托管成本账:从按 Token 计费到单卡 GPU 服务器怎么选?
运维·服务器·开源·llm·agent
NocoBase7 小时前
程序员和软件还有前途吗 —— 从 NocoBase 收入再翻倍谈起
低代码·ai·开源·无代码·管理工具·内部工具·无代码开发平台
「、皓子~7 小时前
海狸IM 2.0 开放能力说明:OAuth2 接入与群推送机器人
人工智能·架构·electron·机器人·开源·交友·im
在水一缸8 小时前
深度解析:GitHub “虚假星星“ 经济链与开源信任危机
开源·github·技术选型·虚假星星·信任危机·灰色产业链
谁在黄金彼岸8 小时前
pywebview桌面程序关闭后同一终端再次启动无响应问题复盘
开源