6G内存运行Llama2-Chinese-7B-chat模型

6G内存运行Llama2-Chinese-7B-chat模型

Llama2-Chinese中文社区

第一步:

从huggingface下载 Llama2-Chinese-7b-Chat-GGML模型放到本地的某一目录。

第二步:

执行python程序

复制代码
git clone  https://github.com/Rayrtfr/llama2-webui.git

cd llama2-webui && pip install -r requirements.txt

# 注意这里的/path/ggml-model-q4_0.bin换成你本地下载的模型路径
python app_4bit_ggml.py \
--model_path /path/ggml-model-q4_0.bin

本地浏览器打开: http://127.0.0.1:8090

相关推荐
人工智能培训8 分钟前
如何利用大语言模型的能力进行实体关系抽取
大数据·人工智能·深度学习·语言模型·自然语言处理·大模型·数字孪生
大写的z先生9 分钟前
【深度学习 | 论文精读】MMTC:融合社交网络特征与图文信息的多模态虚假新闻检测
深度学习·语言模型
jinanwuhuaguo31 分钟前
OpenClaw v2026.3.22-beta.1 深度技术分析报告:从单智能体操作系统到多智能体协作平台的范式跃迁
运维·人工智能·语言模型·自然语言处理·visual studio code·openclaw
啥都鼓捣的小yao1 小时前
What is Prompt Engineering —— 提示词工程是什么?
人工智能·语言模型·prompt
前进的李工1 小时前
LangChain使用之Model IO(提示词模版之FewShotPromptTemplate)
开发语言·人工智能·语言模型·langchain·agent
小柒777772 小时前
PEFT(Parameter-Efficient Fine-Tuning)---LoRa方法
人工智能·深度学习·语言模型
心前阳光2 小时前
Unity使用豆包语言模型
unity·语言模型
小龙报2 小时前
【Coze-AI智能体平台】解锁 Coze 工作流:逻辑控制・数据处理・AIGC 多媒体全场景实战
人工智能·深度学习·机器学习·语言模型·自然语言处理·github·aigc
jbb05233 小时前
国内三家大模型修图能力对比
语言模型
小超同学你好14 小时前
Langgraph 18. Skill 四种形态 —— Inline / File-based / External / Meta(含代码示例)
人工智能·语言模型·langchain