技术栈
推理部署
@鱼香肉丝没有鱼
3 小时前
ai
·
大模型
·
推理部署
分布式推理与量化部署
定义 : 将训练好的模型在特定软硬件环境中启动的过程,使模型能够接收输入并返回预测结果。为了满足性能和效率的需求,常常需要对模型进行优化,例如模型压缩和硬件加速。
我是有底线的