技术栈
llm 推理
Baihai IDP
8 个月前
人工智能
·
llm
·
genai
·
白海科技
·
llm 推理
LLM 推理优化探微 (4) :模型性能瓶颈分类及优化策略
编者按: 在人工智能浪潮袭卷全球的大背景下,进一步提升人工智能模型性能,满足更多应用需求已经刻不容缓。如何优化模型延迟和吞吐量,成为了业界亟待解决的重要问题。