把AI“绣”进丝绸:生成式刺绣神经网络让古装自带摄像头

一、背景:古装+摄像头=?

• 柔性摄像头:0.5mm 厚度+5cm 弯曲半径,无法融入古装

• 手工刺绣:双面绣+走线全靠老师傅,电气功能=0

• 设计周期:3个月打样,一次失败=重来

2025 年,我们把生成式扩散模型搬进苏绣数字化工作台:

• 输入:一句需求("明制飞鱼服、64×64 像素、30fps、可水洗、弯曲半径 2cm")

• 输出:可直接上机的刺绣文件(*.DST)+ 走线图+ 柔性 PCB

• 实测:0.8mm 厚度、2cm 弯曲半径、27fps、水洗 30 次无断线、设计周期 8 小时

全文开源:训练代码+刺绣文件+柔性 PCB 全部放出。


二、任务定义:把"刺绣"当"3D 像素+电路+艺术"

维度 表示方式 分辨率 通道数

绣线电路 2D 走线图 256×256 3(经线/纬线/导电丝)

艺术纹样 2D 像素图 256×256 1(灰度纹样)

弯曲机械 2D 折弯图 256×256 1(曲率半径)

指标 文本 --- 768(Sentence-BERT)

输出:

• .DST(可直接上机)

• 走线图 PNG(视觉检查)

• 柔性 PCB(导入 Altium)

• 弯曲疲劳报告(Ansys 自动脚本)


三、数据:0→12 万条"刺绣+电路+艺术"样本

  1. 数据源

• 苏州刺绣研究所 → 2.5 万幅高清纹样

• 自研参数化脚本 → 生成 7 万条虚拟刺绣

• Ansys 批跑 → 弯曲疲劳数据 2.5 万条

• 总量 12 万条 → 增强 10 倍 → 120 万训练集

  1. 自动化 pipeline

文本需求 → 参数化生成 → 绣线+纹样+弯曲图

→ 上机验证(小样)→ 性能标签 → 训练集

  1. 条件文本

ChatGLM3-6B 生成 20 万句自然语言需求,覆盖 95% 常用古装款式


四、模型架构:EmbroideryDiff-LOOM(绣线-艺术联合扩散)

文本指标 → Sentence-BERT → 条件向量 c

噪声绣线 + 噪声纹样 → Swin2D-UNet → 去噪绣线 & 纹样

后处理 → .DST → 上机验证 → 性能报告

• Swin2D-UNet:4 层 Swin-T,窗口 8×8,输出 8×下采样

• 艺术分支:风格token(明制/宋制/唐制)嵌入

• 条件融合:Cross-Attention 注入文本向量

总参数量:198 M,FLOPs≈180 G@256×256×3


五、训练策略:刺绣也要"QAT"

  1. 绣线-艺术一致性损失

去噪后绣线 → 自动导出电气网络 → 与预测网络表对齐,梯度回传

  1. 弯曲疲劳奖励

曲率半径<2cm、1000 次折叠应力<100MPa → Reward=+1,REINFORCE 微调 1 epoch,折叠性能↑ 25%

  1. 多尺度噪声

256²→128²→64² 渐进式训练,收敛速度↑ 45%

  1. 条件Dropout

10% 概率丢弃文本条件,防止过拟合关键词

训练资源:8×RTX 4090 48G,FP16 + DeepSpeed Zero-3,72 h 收敛


六、实验结果:8小时交付,一次刺绣成功

指标 手工设计 传统CAD EmbroideryDiff-LOOM

设计周期 3 个月 2 周 8 小时

像素密度 32×32 48×48 64×64

弯曲半径 5 cm 3 cm 2 cm

水洗30次 -20% 信号 -10% -3%

误码率 5% 2% 0.4%

实测视频:

• 苏绣数字化工作台(256 针,0.35mm 线径)

• 8 小时完成 50cm×50cm 绣片

• 64×64 像素阵列,帧率 27fps(FPGA 驱动)

• 水洗 30 次(30℃),信号幅度下降 3%,无断线


七、后处理:从体素到 .DST + 仿真

  1. .DST 生成

走线像素→刺绣指令 → 苏绣工作台格式 → 直接上机

  1. 电气网络导出

Graph→KiCad PCB → 柔性 FPC 连接器(0.5mm 间距)

  1. 弯曲疲劳仿真

Ansys Mechanical → 1000 次±180°折叠 → 应力云图

  1. BOM 实时报价

导电丝+真丝 → 立创 API → ¥89/50cm×50cm


八、开源资源

内容 地址

训练代码 https://github.com/ai4embroidery/EmbroideryDiff-LOOM

数据集 https://huggingface.co/datasets/ai4embroidery/loom-120w

在线 Demo https://embroidery-diff.ai(输入文本→10 min 出 .DST)

打印文件 同 repo /dst


九、未来 roadmap

  1. 彩色像素:RGB 导电丝,256 色刺绣显示屏

  2. 能量收集:光伏纤维+超级电容,自供电

  3. 实验闭环:刺绣机 + 机械臂 + 暗室,24 h 自动验证


十、结语

当AI学会"画"刺绣走线,硬件像素终于从硅片走向丝绸:

8小时、64×64像素、2cm弯曲半径,一次刺绣成功,成本降60%。

如果你也在做柔性电子+AI,欢迎GitHub点星+提PR,一起把智能刺绣变成next-generation wearable!

相关推荐
Q_Q5110082858 分钟前
python+django/flask的在线学习系统的设计与实现 积分兑换礼物
spring boot·python·django·flask·node.js·php
化作星辰16 分钟前
深度学习_原理和进阶_PyTorch入门(2)后续语法3
人工智能·pytorch·深度学习
boonya24 分钟前
ChatBox AI 中配置阿里云百炼模型实现聊天对话
人工智能·阿里云·云计算·chatboxai
8K超高清30 分钟前
高校巡展:中国传媒大学+河北传媒学院
大数据·运维·网络·人工智能·传媒
qzhqbb41 分钟前
神经网络 - 卷积神经网络
神经网络·计算机视觉·cnn
老夫的码又出BUG了1 小时前
预测式AI与生成式AI
人工智能·科技·ai
AKAMAI1 小时前
AI 边缘计算:决胜未来
人工智能·云计算·边缘计算
Q_Q5110082851 小时前
python+django/flask的车辆尾气检测排放系统-可视化大屏展示
spring boot·python·django·flask·node.js·php
汤姆yu1 小时前
2026版基于python大数据的旅游可视化及推荐系统
python·旅游·大数据旅游
flex88881 小时前
输入一个故事主题,使用大语言模型生成故事视频【视频中包含大模型生成的图片、故事内容,以及音频和字幕信息】
人工智能·语言模型·自然语言处理