【算法分析】FlashAttention算法演进分析

概述

LLM大模型训练/推理深度依赖FlashAttention算法,本文从Standard Slef-Attention到 FlashAttention,介绍算法的原理和优化演进。

Attention 算法演进 Overview

算法说明

关于FlashAttentionV1 算法的执行过程,请看我的另外一篇博客分析:

【算法分析】FlashAttention算法实例演示_flash attention实例-CSDN博客

关于FlashAttention V2 和 V1 算法的区别,请看我的另外一篇博客分析:

【算法分析】FlashAttention v2算法优化实例说明_如何使用fastattention2-CSDN博客

相关推荐
sbc-study3 分钟前
PCDF (Progressive Continuous Discrimination Filter)模块构建
人工智能·深度学习·计算机视觉
EasonZzzzzzz10 分钟前
计算机视觉——相机标定
人工智能·数码相机·计算机视觉
猿小猴子19 分钟前
主流 AI IDE 之一的 Cursor 介绍
ide·人工智能·cursor
要努力啊啊啊20 分钟前
Reranker + BM25 + FAISS 构建高效的多阶段知识库检索系统一
人工智能·语言模型·自然语言处理·faiss
芜湖xin20 分钟前
【题解-洛谷】P1706 全排列问题
算法·dfs
EasyDSS27 分钟前
国标GB28181设备管理软件EasyGBS远程视频监控方案助力高效安全运营
网络·人工智能
春末的南方城市36 分钟前
港科大&快手提出统一上下文视频编辑 UNIC,各种视频编辑任务一网打尽,还可进行多项任务组合!
人工智能·计算机视觉·stable diffusion·aigc·transformer
小喵喵生气气39 分钟前
Python60日基础学习打卡Day46
深度学习·机器学习
叶子2024221 小时前
学习使用YOLO的predict函数使用
人工智能·学习·yolo
dmy1 小时前
n8n内网快速部署
运维·人工智能·程序员