【算法分析】FlashAttention算法演进分析

HaoBBNuanMM2024-12-03 12:12

概述

LLM大模型训练/推理深度依赖FlashAttention算法，本文从Standard Slef-Attention到 FlashAttention，介绍算法的原理和优化演进。

Attention 算法演进 Overview

算法说明

关于FlashAttentionV1 算法的执行过程，请看我的另外一篇博客分析：

【算法分析】FlashAttention算法实例演示_flash attention实例-CSDN博客

关于FlashAttention V2 和 V1 算法的区别，请看我的另外一篇博客分析：

【算法分析】FlashAttention v2算法优化实例说明_如何使用fastattention2-CSDN博客

上一篇：力扣3372.连接两棵树后最大目标节点数目I

下一篇：段码驱动芯片冷气机LCD驱动芯片VK1024B

热门推荐

01UV安装并设置国内源 02KGG转MP3工具|非KGM文件|解密音频 03Qwen3-Coder 快速上手教程 | Qwen Code + Claude Code 04蜘蛛磁力搜索引擎大全，如何使用蜘蛛磁力查找磁力链接 05Claude Code VSCode集成开发指南：AI编程助手完整配置 06DeepSeek更新！速览DeepSeek V3.1新特性 07【2025.08.06最新版】Android Studio下载、安装及配置记录（自动下载sdk）082025最新国内服务器可用docker源仓库地址大全（2025年8月更新）09NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南 10【踩坑笔记】50系显卡适配的 PyTorch 安装