【算法分析】FlashAttention算法演进分析

概述

LLM大模型训练/推理深度依赖FlashAttention算法,本文从Standard Slef-Attention到 FlashAttention,介绍算法的原理和优化演进。

Attention 算法演进 Overview

算法说明

关于FlashAttentionV1 算法的执行过程,请看我的另外一篇博客分析:

【算法分析】FlashAttention算法实例演示_flash attention实例-CSDN博客

关于FlashAttention V2 和 V1 算法的区别,请看我的另外一篇博客分析:

【算法分析】FlashAttention v2算法优化实例说明_如何使用fastattention2-CSDN博客

相关推荐
爱研究的小牛2 小时前
Runway 技术浅析(七):视频技术中的运动跟踪
人工智能·深度学习·计算机视觉·目标跟踪·aigc
DieYoung_Alive2 小时前
搭建深度学习框架+nn.Module
人工智能·深度学习·yolo
GOTXX2 小时前
修改训练策略,无损提升性能
人工智能·计算机视觉·目标跟踪
被制作时长两年半的个人练习生2 小时前
【pytorch】pytorch的缓存策略——计算机分层理论的另一大例证
人工智能·pytorch·python
霖大侠2 小时前
Adversarial Learning forSemi-Supervised Semantic Segmentation
人工智能·算法·机器学习
lexusv8ls600h3 小时前
AI - 如何构建一个大模型中的Tool
人工智能·langchain·llm
阿华的代码王国3 小时前
【算法】——前缀和(矩阵区域和详解,文末附)
java·开发语言·算法·前缀和
Sunyanhui13 小时前
力扣 LCR训练计划2(剑指 Offer 22. 链表中倒数第k个节点)-140
算法·leetcode·链表
yours_Gabriel3 小时前
【力扣】3274. 检查棋盘方格颜色是否相同
算法·leetcode
Chandler243 小时前
蓝桥杯经验分享
经验分享·算法·蓝桥杯