技术栈
加速 c/c++ 开源项目
Soari
4 小时前
开源
·
github
·
llama
·
llm 推理
·
npu 本地模型推理
·
加速 c/c++ 开源项目
GitHub 开源项目解析:rk‑llama.cpp —— 基于 llama.cpp 的 Rockchip NPU 加速本地推理引擎
随着大语言模型(LLM)在边缘设备和本地部署场景的广泛应用,如何在资源受限的硬件上高效运行这些模型成为一个热门课题。标准的 LLM 推理引擎提供了一套轻量、高效、跨平台的 C/C++ 推理框架,可在 CPU、GPU 甚至 Vulkan、SYCL 等多种硬件上运行 LLM 推理。
我是有底线的