技术栈

中文文档

HyperAI超神经
1 天前
llm·大语言模型·内存管理·vllm·推理加速·kv 缓存·中文文档
【vLLM 学习】Load Sharded StatevLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。
只吹45°风
1 年前
java·spring boot·后端·中文文档
SpringBoot-SpringBoot中文文档Spring Boot是由Pivotal团队提供的一套开源框架,可以简化spring应用的创建及部署。它提供了丰富的Spring模块化支持,可以帮助开发者更轻松快捷地构建出企业级应用。Spring Boot通过自动配置功能,降低了复杂性,同时支持基于JVM的多种开源框架,可以缩短开发时间,使开发更加简单和高效。