把AI“绣”进丝绸:生成式刺绣神经网络让古装自带摄像头

一、背景:古装+摄像头=?

• 柔性摄像头:0.5mm 厚度+5cm 弯曲半径,无法融入古装

• 手工刺绣:双面绣+走线全靠老师傅,电气功能=0

• 设计周期:3个月打样,一次失败=重来

2025 年,我们把生成式扩散模型搬进苏绣数字化工作台:

• 输入:一句需求("明制飞鱼服、64×64 像素、30fps、可水洗、弯曲半径 2cm")

• 输出:可直接上机的刺绣文件(*.DST)+ 走线图+ 柔性 PCB

• 实测:0.8mm 厚度、2cm 弯曲半径、27fps、水洗 30 次无断线、设计周期 8 小时

全文开源:训练代码+刺绣文件+柔性 PCB 全部放出。


二、任务定义:把"刺绣"当"3D 像素+电路+艺术"

维度 表示方式 分辨率 通道数

绣线电路 2D 走线图 256×256 3(经线/纬线/导电丝)

艺术纹样 2D 像素图 256×256 1(灰度纹样)

弯曲机械 2D 折弯图 256×256 1(曲率半径)

指标 文本 --- 768(Sentence-BERT)

输出:

• .DST(可直接上机)

• 走线图 PNG(视觉检查)

• 柔性 PCB(导入 Altium)

• 弯曲疲劳报告(Ansys 自动脚本)


三、数据:0→12 万条"刺绣+电路+艺术"样本

  1. 数据源

• 苏州刺绣研究所 → 2.5 万幅高清纹样

• 自研参数化脚本 → 生成 7 万条虚拟刺绣

• Ansys 批跑 → 弯曲疲劳数据 2.5 万条

• 总量 12 万条 → 增强 10 倍 → 120 万训练集

  1. 自动化 pipeline

文本需求 → 参数化生成 → 绣线+纹样+弯曲图

→ 上机验证(小样)→ 性能标签 → 训练集

  1. 条件文本

ChatGLM3-6B 生成 20 万句自然语言需求,覆盖 95% 常用古装款式


四、模型架构:EmbroideryDiff-LOOM(绣线-艺术联合扩散)

文本指标 → Sentence-BERT → 条件向量 c

噪声绣线 + 噪声纹样 → Swin2D-UNet → 去噪绣线 & 纹样

后处理 → .DST → 上机验证 → 性能报告

• Swin2D-UNet:4 层 Swin-T,窗口 8×8,输出 8×下采样

• 艺术分支:风格token(明制/宋制/唐制)嵌入

• 条件融合:Cross-Attention 注入文本向量

总参数量:198 M,FLOPs≈180 G@256×256×3


五、训练策略:刺绣也要"QAT"

  1. 绣线-艺术一致性损失

去噪后绣线 → 自动导出电气网络 → 与预测网络表对齐,梯度回传

  1. 弯曲疲劳奖励

曲率半径<2cm、1000 次折叠应力<100MPa → Reward=+1,REINFORCE 微调 1 epoch,折叠性能↑ 25%

  1. 多尺度噪声

256²→128²→64² 渐进式训练,收敛速度↑ 45%

  1. 条件Dropout

10% 概率丢弃文本条件,防止过拟合关键词

训练资源:8×RTX 4090 48G,FP16 + DeepSpeed Zero-3,72 h 收敛


六、实验结果:8小时交付,一次刺绣成功

指标 手工设计 传统CAD EmbroideryDiff-LOOM

设计周期 3 个月 2 周 8 小时

像素密度 32×32 48×48 64×64

弯曲半径 5 cm 3 cm 2 cm

水洗30次 -20% 信号 -10% -3%

误码率 5% 2% 0.4%

实测视频:

• 苏绣数字化工作台(256 针,0.35mm 线径)

• 8 小时完成 50cm×50cm 绣片

• 64×64 像素阵列,帧率 27fps(FPGA 驱动)

• 水洗 30 次(30℃),信号幅度下降 3%,无断线


七、后处理:从体素到 .DST + 仿真

  1. .DST 生成

走线像素→刺绣指令 → 苏绣工作台格式 → 直接上机

  1. 电气网络导出

Graph→KiCad PCB → 柔性 FPC 连接器(0.5mm 间距)

  1. 弯曲疲劳仿真

Ansys Mechanical → 1000 次±180°折叠 → 应力云图

  1. BOM 实时报价

导电丝+真丝 → 立创 API → ¥89/50cm×50cm


八、开源资源

内容 地址

训练代码 https://github.com/ai4embroidery/EmbroideryDiff-LOOM

数据集 https://huggingface.co/datasets/ai4embroidery/loom-120w

在线 Demo https://embroidery-diff.ai(输入文本→10 min 出 .DST)

打印文件 同 repo /dst


九、未来 roadmap

  1. 彩色像素:RGB 导电丝,256 色刺绣显示屏

  2. 能量收集:光伏纤维+超级电容,自供电

  3. 实验闭环:刺绣机 + 机械臂 + 暗室,24 h 自动验证


十、结语

当AI学会"画"刺绣走线,硬件像素终于从硅片走向丝绸:

8小时、64×64像素、2cm弯曲半径,一次刺绣成功,成本降60%。

如果你也在做柔性电子+AI,欢迎GitHub点星+提PR,一起把智能刺绣变成next-generation wearable!

相关推荐
码农的神经元1 分钟前
拆解 SDGT 算法:图神经网络 + Transformer 如何做短期电力负荷预测
神经网络·算法·transformer
花椒技术1 分钟前
3个AI维度,揭秘直播平台如何从零搭出主播画像
人工智能·ai编程
格林威4 分钟前
工业视觉检测:单样本学习 vs 传统监督学习
人工智能·深度学习·数码相机·学习·计算机视觉·视觉检测·工业相机
xyx-3v7 分钟前
LUT(Look-Up Table,查找表)的定义与核心概念
fpga开发
遇见~未来10 分钟前
Token、输入输出与缓存——AI开发计费全解
人工智能·缓存
陈序缘12 分钟前
AI Agent 的道与术
人工智能·职场和发展·agi
FrontAI14 分钟前
深入浅出 LangGraph —— 第12章:多Agent系统架构
人工智能·langchain·ai agent·langgraph
Web3VentureView15 分钟前
SYNBO走进以太坊中国高校行复旦大学专场:链接Web3下一代开发者
人工智能·web3·区块链·加密货币·synbo
狐狐生风16 分钟前
LangChain实现简易版-----PDF 文档问答机器人
人工智能·langchain·机器人·pdf·prompt
一水鉴天17 分钟前
从“AI内在机制探询”到“三重三九格人本主权智能体架构”的演进 之2 20260503 (腾讯元宝)
人工智能·架构