技术栈
推理引擎
deepdata_cn
1 天前
人工智能
·
推理引擎
开源本地LLM推理引擎(Cortex AI)
Cortex AI是一款开源本地LLM推理引擎,核心定位是“降低大模型部署门槛”,通过整合多类推理框架、兼容主流API标准,让开发者在本地设备(CPU/GPU)或边缘环境中快速运行大语言模型(包括DBRX、Mixtral等MoE架构模型),无需依赖复杂的集群资源。
✦昨夜星辰✦
1 年前
人工智能
·
系统架构
·
triton
·
推理引擎
·
tensorrt-llm
Triton Inference Server 架构原理
上篇文章进行了 TensorRT-LLM & Triton Server 部署 ,本篇简单讲讲 Triton Inference Server 的架构原理,便于大家更好的做配置和开发。
我是有底线的