技术栈

键值缓存

阿杰学AI
14 天前
人工智能·ai·语言模型·自然语言处理·aigc·kv cache·键值缓存
AI核心知识123—大语言模型之 KV CacheKV Cache (Key-Value Cache,键值缓存) 是大语言模型在推理(生成回答)阶段最核心的加速黑科技,同时也是吞噬显卡内存(VRAM)的头号杀手。
SpikeKing
2 年前
gpt·attention·公式·矩阵乘法·kv cache·decoderonly·键值缓存
LLM - GPT(Decoder Only) 类模型的 KV Cache 公式与原理 教程欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/141605718
我是有底线的