上下文窗口

养肥胖虎14 天前
llm·上下文窗口·contextwindow
完整学习LLM(六):上下文窗口是什么,为什么模型会忘东西好家伙,上一篇我们聊了 Embedding.当时说到一个很关键的点:但这里马上就会遇到一个新问题:比如我问:
七牛云行业应用1 个月前
大语言模型·agent·上下文窗口·技术演进·gpt-5.5
Claude Code10小时限额翻倍后怎么用【2026最新】:/clear、/compact、.claudeignore完整配置Claude Code 是 Anthropic 推出的命令行 AI 编程助手,2026年5月6日的 Code with Claude SF 开发者大会上,Anthropic 宣布与 SpaceX 达成算力合作——接入 Colossus 1 超算中心 22万张 NVIDIA GPU、超 300 兆瓦算力,同日永久将 Pro/Max/Team/Enterprise 方案的 5 小时 Claude Code 使用限额翻倍至 10 小时,并同步取消 Pro 和 Max 方案的高峰时段降速限制。这意味着开发者现在可
黑客思维者6 个月前
笔记·学习·llm·长文本·上下文窗口
LLM底层原理学习笔记:上下文窗口扩展技术如何突破记忆瓶颈,解锁大模型的长文本理解力大型语言模型(LLMs)的能力在很大程度上受限于其能够同时处理的上下文窗口(Context Window)长度。传统的 Transformer 模型通常只能处理 4K 到 8K 的 Token 序列,这使其在处理长篇文档、法律合同或完整技术报告时显得力不从心。近年来,研究者通过引入位置编码外推、稀疏注意力、以及KV缓存压缩等一系列上下文窗口扩展技术,成功将 LLMs 的处理长度推至数万甚至十万 Token 级别。本文将深入解析这些技术背后的原理,阐述它们如何帮助模型理解复杂长文本,并探讨其在专业领域中的关
我是有底线的