大语言模型推理与部署工具介绍

推理与部署

本项目中的相关模型主要支持以下量化、推理和部署方式,具体内容请参考对应教程。

工具 特点 CPU GPU 量化 GUI API vLLM§ 16K‡ 教程
llama.cpp 丰富的量化选项和高效本地推理 link
🤗Transformers 原生transformers推理接口 link
Colab Demo 在Colab中启动交互界面 link
仿OpenAI API调用 仿OpenAI API接口的服务器Demo link
text-generation-webui 前端Web UI界面的部署方式 ✅† link
LangChain 适合二次开发的大模型应用开源框架 ✅† ✅† link
privateGPT 基于LangChain的多文档本地问答框架 link
相关推荐
掘金安东尼1 小时前
养龙虾之前?先搞懂 Skills!
人工智能
chaors2 小时前
从零学RAG0x03第一个实战应用:医疗知识混合检索实战
人工智能·aigc·ai编程
阿聪谈架构2 小时前
第02章:Prompt 工程 —— 用语言精准指挥 AI
人工智能
suke2 小时前
AI 界的 npm 惨案重演?聊聊 龙虾OpenClaw skills那些带毒的“骚操作
人工智能·程序员·aigc
明明如月学长2 小时前
OpneClaw 总挂?配个"保镖"自动修,7x24小时不用管
人工智能
万少3 小时前
用 OpenClaw 实现小红书自动发帖
人工智能
阿聪谈架构4 小时前
第01章:从零开始调用 LLM —— 入门 Qwen 大模型 API
人工智能
七牛云行业应用4 小时前
保姆级 OpenClaw 避坑指南:手把手教你看日志修 Bug,顺畅连通各大 AI 模型
人工智能·后端·node.js
Mintopia4 小时前
OpenClaw在日常开发中的应用实践与全场景解析
人工智能·openai·ai编程
飞哥数智坊5 小时前
从惊艳到落差:龙虾可视化项目 Star-Office-UI 的实测与吐槽
人工智能