transformer 优化笔记 持续更新

目录

[方案2:安装 xformers(推荐)](#方案2:安装 xformers(推荐))

[🚀 核心作用:更高效地计算注意力](#🚀 核心作用:更高效地计算注意力)

xfusers

[💡 为什么需要 xfusers?](#💡 为什么需要 xfusers?)


方案2:安装 xformers(推荐)

复制代码

pip install xformers

然后代码里:

python 复制代码
torch.backends.cuda.enable_mem_efficient_sdp(True)

xformers 是一个由 Meta AI (Facebook Research) 开发的,专门用于优化和加速 Transformer 模型的高性能工具库。你可以把它理解为一套为 Transformer 模型设计的"性能改装件"。

它最核心的价值体现在两点:显著提升运行速度大幅降低显存占用

🚀 核心作用:更高效地计算注意力

Transformer 模型中最消耗计算资源的环节就是"多头注意力"(Multi-Head Attention)机制。xformers 通过提供更优的计算方式,实现了"又快又省"。

核心优势 具体表现 实际价值
⚡ 更快的速度 使用了比如FlashAttention、内存高效注意力等优化的计算方式 能让你更快地训练模型更快地生成图片/文本,有时能带来数倍的加速
💾 更省的显存 采用融合算子(Fused Ops)、稀疏注意力等策略,大大降低计算过程中的显存开销 可以让你在有限的GPU显存下,运行更大的模型 ,或者生成更高分辨率的图像(如在Stable Diffusion中)

xfusers

xfusers 是一个专门用于大规模加速 Diffusion Transformer(DiT)模型推理 的高性能库。它和之前讨论的 xformers 算是"师出同门",但专注的方向很不一样:

  • xformers:主要优化单张显卡上的注意力机制计算,目标是让模型"跑得更快、更省显存"。

  • xfusers:主要解决如何在多张显卡上并行跑大模型的问题,目标是突破单卡显存和算力的极限。

简单来说,xformers 像给一辆车换上了更高效的发动机,而 xfusers 则是让你可以把好几辆车的动力并在一起,去拖动一个超级重的货柜。

💡 为什么需要 xfusers?

Flux、Stable Diffusion 3 这类最新的 DiT 模型,在处理高分辨率图像或长视频时,计算量会爆炸式增长,单张显卡可能"爆显存"或者速度极慢。

xfusers 的目标就是解决这个问题,它通过多种并行计算策略,把模型的计算任务拆分到多张GPU上同时进行。

相关推荐
RainCity11 小时前
Java Swing 自定义组件库分享(十二)
java·笔记·后端
LinXunFeng8 天前
Obsidian - 使用 Share Note 分享笔记并自部署
前端·笔记·github
闪闪发亮的小星星12 天前
高斯光以及高斯光公式解释
笔记
cqbzcsq12 天前
CellFlow虚拟细胞论文阅读
论文阅读·人工智能·笔记·学习·生物信息
阿米亚波12 天前
【Windows】QEMU 启动 openEuler aarch64/arm64 架构系统 + 离线软件源
linux·windows·经验分享·笔记·架构·arm
自传.12 天前
尚硅谷 Vibe Coding|第三章(1) Claude Code深度使用与进阶技巧 学习笔记
笔记·学习·尚硅谷·vibecoding
.千余12 天前
【C++】模板进阶全解:非类型参数|全特化|偏特化|分离编译完全指南
开发语言·c++·笔记·学习·其他
自传.12 天前
尚硅谷 Vibe Coding|第二章 AI编程工具生态 学习笔记
笔记·学习·ai编程·尚硅谷·vibe coding
秋波。未央12 天前
Java Agent 开发 · Day 1 学习笔记(含作业完整标准答案)
java·笔记·学习
中屹指纹浏览器12 天前
2026指纹浏览器字体指纹、字体渲染偏差检测与全维度虚拟字体池搭建方案
经验分享·笔记