LlamaGPT -基于Llama 2的自托管类chatgpt聊天机器人

LlamaGPT一个自托管、离线、类似 ChatGPT 的聊天机器人,由 Llama 2 提供支持。100% 私密,不会有任何数据离开你的设备。

推荐:用 NSDT编辑器 快速搭建可编程3D场景

1、如何安装LlamaGPT

LlamaGPT可以安装在任何x86或arm64系统上。

首先确保你已安装 Docker。然后,克隆此存储库并 进入目录:

复制代码
git clone https://github.com/getumbrel/llama-gpt.git
cd llama-gpt

现在可以使用以下任何模型运行 LlamaGPT,具体取决于你的硬件:

模型大小 使用的模型 所需的最低 RAM 如何启动 LlamaGPT
7B Nous Hermes Llama 2 7B (GGML q4_0) 8GB docker compose up -d
13B Nous Hermes Llama 2 13B (GGML q4_0) 16GB docker compose -f docker-compose-13b.yml up -d
70B Meta Llama 2 70B Chat (GGML q4_0) 48GB docker compose -f docker-compose-70b.yml up -d

可以通过 http://localhost:3000 访问 LlamaGPT。

要停止 LlamaGPT,请运行:

复制代码
docker compose down

2、基准测试

我们在以下硬件上测试了 LlamaGPT 模型,并使用默认系统提示和用户提示:"宇宙如何膨胀?" 温度设置为 0 时保证确定性结果。 生成速度是前 10 代的平均值。

  • Nous Hermes Llama 2 7B (GGML q4_0)
设备 生成速度
M1 Max MacBook Pro (10 64GB RAM) 8.2 令牌/秒
Umbrel Home (16GB RAM) 2.7 令牌/秒
Raspberry Pi 4 (8GB RAM) 0.9 令牌/秒
  • Nous Hermes Llama 2 13B (GGML q4_0)
设备 生成速度
M1 Max MacBook Pro (64GB RAM) 3.7 令牌/秒
Umbrel Home (16GB RAM) 1.5 令牌/秒
  • Meta Llama 2 70B 聊天 (GGML q4_0)

不幸的是,我们还没有这个模型的任何基准。


原文链接:LlamaGPT自托管chatbot --- BimAnt

相关推荐
Agent产品评测局16 分钟前
企业 AI Agent 落地,如何保障数据安全与合规?——企业级智能体安全架构与合规路径深度盘点
人工智能·安全·ai·chatgpt·安全架构
进击切图仔22 分钟前
Docker + tmux + ROS:持久化的机器人开发环境
docker·容器·机器人
abigale031 小时前
从零实现 AI 聊天助手:可直接复用的前端核心方案
chatgpt·vue·流式输出
自动化智库1 小时前
KUKA机器人与伏能士焊机通讯配置
机器人
码上生存指南2 小时前
我让 Claude、ChatGPT、Kimi 同时帮我写代码,差距有点大
ai·chatgpt
maxmaxma3 小时前
ROS2 机器人 少年创客营:Day 5
机器人·ros2
TE-茶叶蛋3 小时前
AI聊天机器人 / 轻量级对话系统(调用闭源API)
人工智能·机器人
无心水4 小时前
【OpenClaw:赚钱】案例9、模拟盘ROI+1560%:跨平台加密预测市场套利机器人全栈开发指南
机器人·区块链·金融科技·roi·openclaw·openclaw 变现
积跬步,慕至千里4 小时前
2026年2月读书笔记|AI大模型助你轻松搞定数据分析
语言模型·chatgpt
逻辑君6 小时前
Research in Brain-inspired Computing [9]-球机器人研究【2】
人工智能·深度学习·神经网络·机器人