6G内存运行Llama2-Chinese-7B-chat模型

6G内存运行Llama2-Chinese-7B-chat模型

Llama2-Chinese中文社区

第一步:

从huggingface下载 Llama2-Chinese-7b-Chat-GGML模型放到本地的某一目录。

第二步:

执行python程序

复制代码
git clone  https://github.com/Rayrtfr/llama2-webui.git

cd llama2-webui && pip install -r requirements.txt

# 注意这里的/path/ggml-model-q4_0.bin换成你本地下载的模型路径
python app_4bit_ggml.py \
--model_path /path/ggml-model-q4_0.bin

本地浏览器打开: http://127.0.0.1:8090

相关推荐
Jamence6 小时前
多模态大语言模型arxiv论文略读(七十五)
人工智能·语言模型·自然语言处理
小众AI6 小时前
UI-TARS: 基于视觉语言模型的多模式代理
人工智能·ui·语言模型
微凉的衣柜8 小时前
使用GRPO训练调度事件的语言模型!
语言模型·推理模型
fydw_7158 小时前
级联与端到端对话系统架构解析:以Moshi为例
语言模型
艾醒(AiXing-w)10 小时前
探索大语言模型(LLM):国产大模型DeepSeek vs Qwen,谁才是AI模型的未来?
大数据·人工智能·语言模型
AI大模型顾潇13 小时前
[特殊字符] 本地大模型编程实战(29):用大语言模型LLM查询图数据库NEO4J(2)
前端·数据库·人工智能·语言模型·自然语言处理·prompt·neo4j
tongxianchao14 小时前
精简大语言模型:用于定制语言模型的自适应知识蒸馏
人工智能·语言模型·自然语言处理
侃山14 小时前
NNLM神经网络语言模型总结
人工智能·神经网络·语言模型
yu41062121 小时前
2025年中期大语言模型实力深度剖析
人工智能·语言模型·自然语言处理
LinkTime_Cloud1 天前
谷歌引入 AI 反诈系统:利用语言模型分析潜在恶意网站
人工智能·语言模型·自然语言处理