LlamaGPT -基于Llama 2的自托管类chatgpt聊天机器人

LlamaGPT一个自托管、离线、类似 ChatGPT 的聊天机器人,由 Llama 2 提供支持。100% 私密,不会有任何数据离开你的设备。

推荐:用 NSDT编辑器 快速搭建可编程3D场景

1、如何安装LlamaGPT

LlamaGPT可以安装在任何x86或arm64系统上。

首先确保你已安装 Docker。然后,克隆此存储库并 进入目录:

复制代码
git clone https://github.com/getumbrel/llama-gpt.git
cd llama-gpt

现在可以使用以下任何模型运行 LlamaGPT,具体取决于你的硬件:

模型大小 使用的模型 所需的最低 RAM 如何启动 LlamaGPT
7B Nous Hermes Llama 2 7B (GGML q4_0) 8GB docker compose up -d
13B Nous Hermes Llama 2 13B (GGML q4_0) 16GB docker compose -f docker-compose-13b.yml up -d
70B Meta Llama 2 70B Chat (GGML q4_0) 48GB docker compose -f docker-compose-70b.yml up -d

可以通过 http://localhost:3000 访问 LlamaGPT。

要停止 LlamaGPT,请运行:

复制代码
docker compose down

2、基准测试

我们在以下硬件上测试了 LlamaGPT 模型,并使用默认系统提示和用户提示:"宇宙如何膨胀?" 温度设置为 0 时保证确定性结果。 生成速度是前 10 代的平均值。

  • Nous Hermes Llama 2 7B (GGML q4_0)
设备 生成速度
M1 Max MacBook Pro (10 64GB RAM) 8.2 令牌/秒
Umbrel Home (16GB RAM) 2.7 令牌/秒
Raspberry Pi 4 (8GB RAM) 0.9 令牌/秒
  • Nous Hermes Llama 2 13B (GGML q4_0)
设备 生成速度
M1 Max MacBook Pro (64GB RAM) 3.7 令牌/秒
Umbrel Home (16GB RAM) 1.5 令牌/秒
  • Meta Llama 2 70B 聊天 (GGML q4_0)

不幸的是,我们还没有这个模型的任何基准。


原文链接:LlamaGPT自托管chatbot --- BimAnt

相关推荐
没有梦想的咸鱼185-1037-16635 小时前
AI-Python机器学习、深度学习核心技术与前沿应用及OpenClaw、Hermes自动化编程
人工智能·python·深度学习·机器学习·chatgpt·数据挖掘·数据分析
TGITCIC8 小时前
大模型训练师的炼丹之道 (1)-最新版llama-factory环境搭建和全排错
微调·sft·llama·模型训练·训练·大模型训练·llama-factory
郭龙飞98010 小时前
OpenClaw 飞书机器人搭建指南 远程 AI 操控电脑配置
人工智能·windows·机器人·飞书
数智工坊11 小时前
具身智能人形机器人:从实验室走向现实的下一代通用智能体
人工智能·深度学习·机器人
可夫小子11 小时前
注册 ChatGPT 第 N 个账号的正确方法:用 Cloudflare 造邮箱
chatgpt
Freak嵌入式12 小时前
WIZnet-EVB-Pico2开始,用MicroPython玩转以太网开发
arm开发·人工智能·python·嵌入式硬件·机器人·嵌入式·micropython
高德诚13 小时前
软件工程师视角:机器人舵机软件定制化研发的核心思路与实操方法
机器人
沫儿笙13 小时前
弧焊机器人混合气节气设备
人工智能·物联网·机器人
Caster_Z14 小时前
Win10本地部署QQ智能机器人:AstrBot+NapCat+DeepSeekAI
机器人·deepseek·napcat·astrbot·自动客服
TMT星球14 小时前
科技领跑公益,擎天租机器人“天团”助阵2026渣打上海10公里跑
人工智能·科技·机器人