6G内存运行Llama2-Chinese-7B-chat模型

蓝鲸1232023-07-29 20:58

6G内存运行Llama2-Chinese-7B-chat模型

Llama2-Chinese中文社区

第一步：

从huggingface下载 Llama2-Chinese-7b-Chat-GGML模型放到本地的某一目录。

第二步：

执行python程序

复制代码

git clone  https://github.com/Rayrtfr/llama2-webui.git

cd llama2-webui && pip install -r requirements.txt

# 注意这里的/path/ggml-model-q4_0.bin换成你本地下载的模型路径
python app_4bit_ggml.py \
--model_path /path/ggml-model-q4_0.bin

本地浏览器打开: http://127.0.0.1:8090

上一篇：文心一言 VS 讯飞星火 VS chatgpt （67）-- 算法导论6.5 6题

下一篇：NoSQL之Redis配置使用

热门推荐

01GitHub 镜像站点 02【超详细教程】手把手教你从微软官网免费下载Windows 10官方原版ISO镜像（2025最新版）03UV安装并设置国内源 04React CVE-2025-55182漏洞排查与修复指南 05BongoCat - 跨平台键盘猫动画工具 06安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口（持续更新）07本地部署阿里最新开源的Z-Image 08Linux下V2Ray安装配置指南 09Labelme从安装到标注：零基础完整指南 10Meta第三代“分割一切”模型——SAM 3本地部署教程：首支持文本提示分割，400万概念、30毫秒响应，检测分割追踪一网打尽