技术栈

上下文压缩

长路 ㅤ   
16 天前
react agent·上下文压缩·token优化·大模型agent
通用Agent设计:03、大模型Agent上下文压缩实战:从原理到CompactSummarizationMiddleware实现博主介绍:✌目前全网粉丝4W+,csdn博客专家、Java领域优质创作者,博客之星、阿里云平台优质作者、专注于Java后端技术领域。
董厂长
4 个月前
langchain·上下文压缩·上下文管理
langchain上下文管理的方式上下文管理是实现复杂推理、工具调用和多轮交互的基础能力。本文将系统梳理上下文管理的核心方法、工程挑战、典型应用场景,并结合 LangChain 框架的设计理念,帮助理解和落地上下文管理系统。
真·skysys
5 个月前
ocr·多模态·deepseek·上下文工程·deepseek-ocr·上下文压缩·上下文光学压缩
【技术报告解读】DeepSeek-OCR: Contexts Optical Compression我们提出了 DeepSeek-OCR,作为通过光学二维映射压缩长上下文可行性的初步探索。DeepSeek-OCR 由两个组件构成:DeepEncoder 和作为解码器的 DeepSeek3B-MoE-A570M。具体而言,DeepEncoder 作为核心引擎,旨在在高分辨率输入下保持低激活值,同时实现高压缩率,以确保视觉 token 数量可控且高效。实验表明,当文本 token 数量不超过视觉 token 数量的 10 倍(即压缩率小于 10×)时,模型可实现 97% 的 OCR 解码精度。即使在 20×
我是有底线的