Transformer和LLM前沿内容(4):Long-Context LLM

文章目录

      • [1. Context Extension](#1. Context Extension)
        • [1.1 Rotary Position Embedding (RoPE)](#1.1 Rotary Position Embedding (RoPE))
        • [1.2 LongLoRA](#1.2 LongLoRA)
      • [2. Evaluation of Long-Context LLMs](#2. Evaluation of Long-Context LLMs)
        • [2.1 The Lost in the Middle Phenomenon](#2.1 The Lost in the Middle Phenomenon)
        • [2.2 Long-Context Benchmarks: NIAH, LongBench](#2.2 Long-Context Benchmarks: NIAH, LongBench)
      • [3. Efficient Attention Mechanisms](#3. Efficient Attention Mechanisms)
        • [3.1 KV Cache](#3.1 KV Cache)
        • [3.2 StreamingLLM and Attention Sinks(重点)](#3.2 StreamingLLM and Attention Sinks(重点))
        • [3.3 DuoAttention: Retrieval Heads and Streaming Heads (重点)](#3.3 DuoAttention: Retrieval Heads and Streaming Heads (重点))
        • [3.4 Quest: Query-Aware Sparsity(重点)](#3.4 Quest: Query-Aware Sparsity(重点))
      • [4. Beyond Transformers](#4. Beyond Transformers)
        • [4.1 State-Space Models (SSMs): Mamba](#4.1 State-Space Models (SSMs): Mamba)
        • [4.2 Hybrid Models: Jamba](#4.2 Hybrid Models: Jamba)

1. Context Extension

1.1 Rotary Position Embedding (RoPE)

1.2 LongLoRA




2. Evaluation of Long-Context LLMs

2.1 The Lost in the Middle Phenomenon
2.2 Long-Context Benchmarks: NIAH, LongBench



3. Efficient Attention Mechanisms

3.1 KV Cache


3.2 StreamingLLM and Attention Sinks(重点)














3.3 DuoAttention: Retrieval Heads and Streaming Heads (重点)









3.4 Quest: Query-Aware Sparsity(重点)









4. Beyond Transformers

4.1 State-Space Models (SSMs): Mamba





4.2 Hybrid Models: Jamba




相关推荐
TechPioneer_lp9 小时前
30 岁硕士 Linux C 开发背景,未来想去澳洲就业,研究方向该选 AI、SDN 漏洞还是 Linux 内核?
linux·人工智能·职业规划·澳洲求职
阿里云大数据AI技术10 小时前
Hologres CLI 与 Skills 担当 Agent-Ready 基础设施,共建数仓智能新生态
人工智能·agent
Terrence Shen10 小时前
大模型部署工具对比
人工智能·深度学习·计算机视觉
视觉&物联智能10 小时前
【杂谈】-企业人工智能超越实验:安全拓展的实践路径
人工智能·安全·aigc·agent·agi
ting945200010 小时前
Kirki 深度技术解析:WordPress 自定义控件开发与可视化配置底层原理
人工智能·架构
掘金一周10 小时前
想换一辆电车,JYM有什么推荐 | 沸点周刊 5.21
前端·人工智能·后端
创世宇图10 小时前
【AI入门知识点】LLM 原理是什么?为什么 ChatGPT 看起来像“会思考”?
人工智能·ai·llm·token
不爱吃糖的程序媛10 小时前
2026年Electron 鸿蒙PC环境搭建指南
人工智能·华为·harmonyos
码途漫谈10 小时前
让 AI 编程不断线:9Router 的本地模型路由与 Token 节流术
人工智能·ai·开源·ai编程
nashane10 小时前
HarmonyOS 6学习:长截图功能开发中的滚动拼接与权限处理实战
人工智能·华为·harmonyos