线性注意力(Linear Attention)线性注意力的诞生,本质是为了解决标准Transformer自注意力平方算力瓶颈,整体发展可划分为四个关键阶段,演进脉络清晰: 1.萌芽探索期(2018-2019):理论铺垫:研究者发现可通过核函数数学技巧规避Softmax指数运算,尝试降低注意力复杂度,但早期方案精度差、优化不成熟,行业主流仍依赖稀疏注意力。 2.正式诞生期(2020):概念确立:核心论文《Transformers are RNNs》问世,正式提出线性注意力范式,通过矩阵乘法结合律改写计算顺序,证明注意力可实现O(N)线性复杂度,奠定技术