6G内存运行Llama2-Chinese-7B-chat模型

6G内存运行Llama2-Chinese-7B-chat模型

Llama2-Chinese中文社区

第一步:

从huggingface下载 Llama2-Chinese-7b-Chat-GGML模型放到本地的某一目录。

第二步:

执行python程序

复制代码
git clone  https://github.com/Rayrtfr/llama2-webui.git

cd llama2-webui && pip install -r requirements.txt

# 注意这里的/path/ggml-model-q4_0.bin换成你本地下载的模型路径
python app_4bit_ggml.py \
--model_path /path/ggml-model-q4_0.bin

本地浏览器打开: http://127.0.0.1:8090

相关推荐
华清远见成都中心1 小时前
大语言模型(LLM)中的KV缓存压缩与动态稀疏注意力机制设计
人工智能·缓存·语言模型
伪_装14 小时前
大语言模型(LLM)面试问题集
人工智能·语言模型·自然语言处理
m0_465215791 天前
大语言模型解析
人工智能·语言模型·自然语言处理
阿部多瑞 ABU1 天前
主流大语言模型安全性测试(三):阿拉伯语越狱提示词下的表现与分析
人工智能·安全·ai·语言模型·安全性测试
要努力啊啊啊1 天前
Reranker + BM25 + FAISS 构建高效的多阶段知识库检索系统一
人工智能·语言模型·自然语言处理·faiss
J_Xiong01172 天前
【LLMs篇】14:扩散语言模型的理论优势与局限性
人工智能·语言模型·自然语言处理
盛寒2 天前
N元语言模型 —— 一文讲懂!!!
人工智能·语言模型·自然语言处理
PythonFun2 天前
DeepSeek-R1-0528:开源推理模型的革新与突破
语言模型·开源
Jamence2 天前
多模态大语言模型arxiv论文略读(111)
论文阅读·人工智能·语言模型·自然语言处理·论文笔记
小天才才2 天前
【自然语言处理】大模型时代的数据标注(主动学习)
人工智能·机器学习·语言模型·自然语言处理