大语言模型推理与部署工具介绍

推理与部署

本项目中的相关模型主要支持以下量化、推理和部署方式,具体内容请参考对应教程。

工具 特点 CPU GPU 量化 GUI API vLLM§ 16K‡ 教程
llama.cpp 丰富的量化选项和高效本地推理 link
🤗Transformers 原生transformers推理接口 link
Colab Demo 在Colab中启动交互界面 link
仿OpenAI API调用 仿OpenAI API接口的服务器Demo link
text-generation-webui 前端Web UI界面的部署方式 ✅† link
LangChain 适合二次开发的大模型应用开源框架 ✅† ✅† link
privateGPT 基于LangChain的多文档本地问答框架 link
相关推荐
youcans_1 天前
【HALCON机器视觉实战】专栏介绍
图像处理·人工智能·计算机视觉·halcon
火山引擎开发者社区1 天前
火山引擎 veRoCE 获权威认证:IANA 官方为 veRoCE 分配专属 UDP 端口号 4794
人工智能
飘落的数码折腾日记1 天前
你的AI Agent可能正在“叛变“ | 5类真实威胁与四层防御
人工智能
放羊郎1 天前
基于ORB-SLAM2算法的优化工作
人工智能·算法·计算机视觉
AI袋鼠帝1 天前
字节的技术决心,都藏在这个动作里
人工智能
AI袋鼠帝1 天前
企微又偷偷进化AI,并开始不对劲了..
人工智能
工业机器人销售服务1 天前
2026 年,探索专业伯朗特机器人的奇妙世界
人工智能·机器人
摆烂大大王1 天前
AI 日报|2026年5月9日:四部门力推AI与能源双向赋能,AI终端国标出台,中国大模型融资潮涌
人工智能
萑澈1 天前
编程能力强和多模态模型的模型后训练
人工智能·深度学习·机器学习
LaughingZhu1 天前
Product Hunt 每日热榜 | 2026-05-08
人工智能·经验分享·深度学习·神经网络·产品运营