大语言模型推理与部署工具介绍

推理与部署

本项目中的相关模型主要支持以下量化、推理和部署方式,具体内容请参考对应教程。

工具 特点 CPU GPU 量化 GUI API vLLM§ 16K‡ 教程
llama.cpp 丰富的量化选项和高效本地推理 link
🤗Transformers 原生transformers推理接口 link
Colab Demo 在Colab中启动交互界面 link
仿OpenAI API调用 仿OpenAI API接口的服务器Demo link
text-generation-webui 前端Web UI界面的部署方式 ✅† link
LangChain 适合二次开发的大模型应用开源框架 ✅† ✅† link
privateGPT 基于LangChain的多文档本地问答框架 link
相关推荐
西柚小萌新2 分钟前
【深度学习:进阶篇】--2.4.BN与神经网络调优
人工智能·深度学习·神经网络
金融小师妹5 分钟前
解码美元-黄金负相关:LSTM-Attention因果发现与黄金反弹推演
大数据·人工智能·算法
DZSpace8 分钟前
AI Agent 核心策略解析:Function Calling 与 ReAct 的设计哲学与应用实践
人工智能·大模型
小郑00112 分钟前
智能体还能配置MCP?智灵助理:打造智能交互新时代的全能助手
人工智能
AI大模型技术社16 分钟前
神经网络学习路线图:从感知机到Transformer的认知跃迁
人工智能
黄卷青灯7727 分钟前
把下载的ippicv.tgz放入<opencv_build_dir>/3rdparty/ippicv/download/中cmake依然无法识别
人工智能·opencv·计算机视觉·ippicv
程序员老刘41 分钟前
MCP:新时代的API,每个程序员都应该掌握
人工智能·flutter·mcp
Humbunklung1 小时前
全连接层和卷积层
人工智能·python·深度学习·神经网络·机器学习·cnn
广州山泉婚姻1 小时前
解锁高效开发:Spring Boot 3和MyBatis-Flex在智慧零工平台后端的应用实战
人工智能·spring boot·spring
三花AI1 小时前
Higgsfield AI 整合 Flux.1 Kontext:一站式创意工作流解决方案
人工智能