【算法分析】FlashAttention算法演进分析

概述

LLM大模型训练/推理深度依赖FlashAttention算法,本文从Standard Slef-Attention到 FlashAttention,介绍算法的原理和优化演进。

Attention 算法演进 Overview

算法说明

关于FlashAttentionV1 算法的执行过程,请看我的另外一篇博客分析:

【算法分析】FlashAttention算法实例演示_flash attention实例-CSDN博客

关于FlashAttention V2 和 V1 算法的区别,请看我的另外一篇博客分析:

【算法分析】FlashAttention v2算法优化实例说明_如何使用fastattention2-CSDN博客

相关推荐
MiaoChuAI2 分钟前
豆包AI PPT与秒出PPT对比评测:谁更适合你?
人工智能·powerpoint
呼啸长风16 分钟前
漫谈散列函数
算法
%KT%20 分钟前
简单聊聊多模态大语言模型MLLM
人工智能·语言模型·自然语言处理
NAGNIP20 分钟前
彻底搞懂 RoPE:位置编码的新范式
算法
NAGNIP27 分钟前
一文搞懂位置编码Positional Encoding
算法
唐某人丶28 分钟前
教你如何用 JS 实现一个 Agent 系统(1)—— 认识 Agentic System
前端·人工智能
泡泡茶壶_ovo35 分钟前
RORPCAP: retrieval-based objects and relations prompt for image captioning
人工智能·深度学习·计算机视觉·语言模型·prompt·多模态·imagecaptioning
MaxCode-139 分钟前
单智能体篇:Prompt工程艺术
大数据·人工智能·prompt
Ghost-Face1 小时前
关于模运算
算法
小鹿的工作手帐1 小时前
有鹿机器人:智慧清洁新时代的引领者
人工智能·科技·机器人