6G内存运行Llama2-Chinese-7B-chat模型

6G内存运行Llama2-Chinese-7B-chat模型

Llama2-Chinese中文社区

第一步:

从huggingface下载 Llama2-Chinese-7b-Chat-GGML模型放到本地的某一目录。

第二步:

执行python程序

复制代码
git clone  https://github.com/Rayrtfr/llama2-webui.git

cd llama2-webui && pip install -r requirements.txt

# 注意这里的/path/ggml-model-q4_0.bin换成你本地下载的模型路径
python app_4bit_ggml.py \
--model_path /path/ggml-model-q4_0.bin

本地浏览器打开: http://127.0.0.1:8090

相关推荐
Protein Designer7 小时前
Deepseek-V4-Flash 快速部署与调用指南
语言模型
AI 小老六10 小时前
Claude Code 如何压缩上下文:Microcompact、Prompt Cache 与 cache_edits 工程拆解
数据库·人工智能·ai·语言模型·架构·系统架构
lqqjuly10 小时前
注意力机制完全详解
人工智能·语言模型
风落无尘10 小时前
第十章《多模态与具身》 完整学习资料
人工智能·语言模型·aigc
lqqjuly14 小时前
词嵌入与语言模型详解
人工智能·语言模型
城管不管15 小时前
什么是Prompt?
android·java·数据库·语言模型·llm·prompt
YueJoy.AI15 小时前
AI应用的容器化部署:从Docker到Kubernetes
人工智能·ai·语言模型
学习中.........16 小时前
大语言模型的采样参数与输出控制机制
人工智能·机器学习·语言模型
wabs66616 小时前
本科毕业设计项目——基于RAG与大语言模型的408问答系统设计与实现【检索与生成功能的第三步答案生成是怎么实现的?】
人工智能·语言模型·自然语言处理
z小猫不吃鱼17 小时前
09 GPT-2 论文精读:语言模型如何走向 Zero-shot?
人工智能·gpt·语言模型