模型下载与使用

模型选择

根据个人电脑配置及使用场景,我选择模型为Qwen-4B-Chat-Q4_K_M

模型下载

模型需要从Huggingface模型库下载,需要使用平台工具来下载

注:使用wget无法下载

安装工具

pip install -U huggingface_hub

网络问题,需要使用镜像

export HF_ENDPOINT="https://hf-mirror.com"

原始模型下载

huggingface-cli download Qwen/Qwen1.5-4B-Chat --local-dir ./models/Qwen1.5-4B-Chat

原始模型需要进行量化转换

转换需要安装依赖,进入llama.cpp-b8642目录,执行如下命令进行安装

pip install -r requirements.txt

注:安装依赖要求Python 3.10以上版本,因此笔者并没有成功转换,使用第二在方法:

直接下载现成的 GGUF 模型

huggingface-cli download itlwas/Qwen1.5-4B-Chat-Q4_K_M-GGUF qwen1.5-4b-chat-q4_k_m.gguf --local-dir ./ --local-dir-use-symlinks False

webui启动

./build/bin/llama-server -m models/qwen-4b-chat.Q4_K_M.gguf -c 4096 -ngl 35 --host 0.0.0.0 --port 8080

使用

http://127.0.0.1:8080/

有如下界面

相关推荐
进击切图仔3 天前
微调 qwen 时候踩坑记录
torch·tensorrt·qwen
故事还在继续吗9 天前
Mac 本地部署大模型
macos·llm·qwen
YJlio14 天前
OpenClaw v2026.3.23-2 更新解析:Qwen 接入、Knot 主题、插件稳定性、升级验证与避坑清单
自动化运维·qwen·版本更新·ai agent·插件系统·openclaw·clawhub
YJlio14 天前
OpenClaw v2026.3.28 更新解析:Qwen 认证迁移、xAI Responses API、MiniMax 图像生成、插件审批与升级避坑
自动化运维·qwen·版本更新·ai agent·插件系统·xai·openclaw
今夕资源网19 天前
Qwen3-TTS官方原功能启动版一键启动包 支持3秒克隆 情绪控制 语音设计
qwen·语音克隆·克隆声音·qwen3tts·qwentts·tts软件·音色设计
搬砖魁首23 天前
基础能力系列 - 如何安全养虾? - 容器化部署龙虾
docker·qwen·openclaw·龙虾
Anesthesia丶25 天前
Qwen2.5-1.5b 模型部署与LORA训练笔记
pytorch·python·lora·llm·qwen·vllm
搬砖的前端1 个月前
本地模型+TRAE CN 打造最优模型组合实测:开源主模型+本地辅模型,对标GPT5.2/5.3/Gemini-3-Flash
前端·ai·mac·ai编程·qwen·trae·qwen3.6
碳基硅坊1 个月前
Mac Studio M3 Ultra 运行大模型实测:Qwen3.6 vs 6款主流模型工具调用对比
人工智能·qwen·qwen3.6