把AI“绣”进丝绸:生成式刺绣神经网络让古装自带摄像头

一、背景:古装+摄像头=?

• 柔性摄像头:0.5mm 厚度+5cm 弯曲半径,无法融入古装

• 手工刺绣:双面绣+走线全靠老师傅,电气功能=0

• 设计周期:3个月打样,一次失败=重来

2025 年,我们把生成式扩散模型搬进苏绣数字化工作台:

• 输入:一句需求("明制飞鱼服、64×64 像素、30fps、可水洗、弯曲半径 2cm")

• 输出:可直接上机的刺绣文件(*.DST)+ 走线图+ 柔性 PCB

• 实测:0.8mm 厚度、2cm 弯曲半径、27fps、水洗 30 次无断线、设计周期 8 小时

全文开源:训练代码+刺绣文件+柔性 PCB 全部放出。


二、任务定义:把"刺绣"当"3D 像素+电路+艺术"

维度 表示方式 分辨率 通道数

绣线电路 2D 走线图 256×256 3(经线/纬线/导电丝)

艺术纹样 2D 像素图 256×256 1(灰度纹样)

弯曲机械 2D 折弯图 256×256 1(曲率半径)

指标 文本 --- 768(Sentence-BERT)

输出:

• .DST(可直接上机)

• 走线图 PNG(视觉检查)

• 柔性 PCB(导入 Altium)

• 弯曲疲劳报告(Ansys 自动脚本)


三、数据:0→12 万条"刺绣+电路+艺术"样本

  1. 数据源

• 苏州刺绣研究所 → 2.5 万幅高清纹样

• 自研参数化脚本 → 生成 7 万条虚拟刺绣

• Ansys 批跑 → 弯曲疲劳数据 2.5 万条

• 总量 12 万条 → 增强 10 倍 → 120 万训练集

  1. 自动化 pipeline

文本需求 → 参数化生成 → 绣线+纹样+弯曲图

→ 上机验证(小样)→ 性能标签 → 训练集

  1. 条件文本

ChatGLM3-6B 生成 20 万句自然语言需求,覆盖 95% 常用古装款式


四、模型架构:EmbroideryDiff-LOOM(绣线-艺术联合扩散)

文本指标 → Sentence-BERT → 条件向量 c

噪声绣线 + 噪声纹样 → Swin2D-UNet → 去噪绣线 & 纹样

后处理 → .DST → 上机验证 → 性能报告

• Swin2D-UNet:4 层 Swin-T,窗口 8×8,输出 8×下采样

• 艺术分支:风格token(明制/宋制/唐制)嵌入

• 条件融合:Cross-Attention 注入文本向量

总参数量:198 M,FLOPs≈180 G@256×256×3


五、训练策略:刺绣也要"QAT"

  1. 绣线-艺术一致性损失

去噪后绣线 → 自动导出电气网络 → 与预测网络表对齐,梯度回传

  1. 弯曲疲劳奖励

曲率半径<2cm、1000 次折叠应力<100MPa → Reward=+1,REINFORCE 微调 1 epoch,折叠性能↑ 25%

  1. 多尺度噪声

256²→128²→64² 渐进式训练,收敛速度↑ 45%

  1. 条件Dropout

10% 概率丢弃文本条件,防止过拟合关键词

训练资源:8×RTX 4090 48G,FP16 + DeepSpeed Zero-3,72 h 收敛


六、实验结果:8小时交付,一次刺绣成功

指标 手工设计 传统CAD EmbroideryDiff-LOOM

设计周期 3 个月 2 周 8 小时

像素密度 32×32 48×48 64×64

弯曲半径 5 cm 3 cm 2 cm

水洗30次 -20% 信号 -10% -3%

误码率 5% 2% 0.4%

实测视频:

• 苏绣数字化工作台(256 针,0.35mm 线径)

• 8 小时完成 50cm×50cm 绣片

• 64×64 像素阵列,帧率 27fps(FPGA 驱动)

• 水洗 30 次(30℃),信号幅度下降 3%,无断线


七、后处理:从体素到 .DST + 仿真

  1. .DST 生成

走线像素→刺绣指令 → 苏绣工作台格式 → 直接上机

  1. 电气网络导出

Graph→KiCad PCB → 柔性 FPC 连接器(0.5mm 间距)

  1. 弯曲疲劳仿真

Ansys Mechanical → 1000 次±180°折叠 → 应力云图

  1. BOM 实时报价

导电丝+真丝 → 立创 API → ¥89/50cm×50cm


八、开源资源

内容 地址

训练代码 https://github.com/ai4embroidery/EmbroideryDiff-LOOM

数据集 https://huggingface.co/datasets/ai4embroidery/loom-120w

在线 Demo https://embroidery-diff.ai(输入文本→10 min 出 .DST)

打印文件 同 repo /dst


九、未来 roadmap

  1. 彩色像素:RGB 导电丝,256 色刺绣显示屏

  2. 能量收集:光伏纤维+超级电容,自供电

  3. 实验闭环:刺绣机 + 机械臂 + 暗室,24 h 自动验证


十、结语

当AI学会"画"刺绣走线,硬件像素终于从硅片走向丝绸:

8小时、64×64像素、2cm弯曲半径,一次刺绣成功,成本降60%。

如果你也在做柔性电子+AI,欢迎GitHub点星+提PR,一起把智能刺绣变成next-generation wearable!

相关推荐
love530love8 小时前
Windows 下 GCC 编译器安装与排错实录
人工智能·windows·python·gcc·msys2·gtk·msys2 mingw 64
倔强的石头1068 小时前
归纳偏好 —— 机器学习的 “择偶标准”
人工智能·机器学习
zhangshuang-peta8 小时前
通过MCP实现安全的多渠道人工智能集成
人工智能·ai agent·mcp·peta
听麟8 小时前
HarmonyOS 6.0+ APP AR文旅导览系统开发实战:空间定位与文物交互落地
人工智能·深度学习·华为·ar·wpf·harmonyos
AI_56788 小时前
阿里云OSS成本优化:生命周期规则+分层存储省70%
运维·数据库·人工智能·ai
龙山云仓8 小时前
MES系统超融合架构
大数据·数据库·人工智能·sql·机器学习·架构·全文检索
zxsz_com_cn8 小时前
设备预测性维护指的是什么 设备预测性维护传感器的作用
人工智能
可编程芯片开发8 小时前
基于PSO粒子群优化PI控制器的无刷直流电机最优控制系统simulink建模与仿真
人工智能·算法·simulink·pso·pi控制器·pso-pi
迎仔8 小时前
02-AI常见名词通俗解释
人工智能
程序员ken8 小时前
深入理解大语言模型(8) 使用 LangChain 开发应用程序之上下文记忆
人工智能·python·语言模型·langchain