模型下载与使用

模型选择

根据个人电脑配置及使用场景,我选择模型为Qwen-4B-Chat-Q4_K_M

模型下载

模型需要从Huggingface模型库下载,需要使用平台工具来下载

注:使用wget无法下载

安装工具

pip install -U huggingface_hub

网络问题,需要使用镜像

export HF_ENDPOINT="https://hf-mirror.com"

原始模型下载

huggingface-cli download Qwen/Qwen1.5-4B-Chat --local-dir ./models/Qwen1.5-4B-Chat

原始模型需要进行量化转换

转换需要安装依赖,进入llama.cpp-b8642目录,执行如下命令进行安装

pip install -r requirements.txt

注:安装依赖要求Python 3.10以上版本,因此笔者并没有成功转换,使用第二在方法:

直接下载现成的 GGUF 模型

huggingface-cli download itlwas/Qwen1.5-4B-Chat-Q4_K_M-GGUF qwen1.5-4b-chat-q4_k_m.gguf --local-dir ./ --local-dir-use-symlinks False

webui启动

./build/bin/llama-server -m models/qwen-4b-chat.Q4_K_M.gguf -c 4096 -ngl 35 --host 0.0.0.0 --port 8080

使用

http://127.0.0.1:8080/

有如下界面

相关推荐
搬砖魁首3 天前
基础能力系列 - 如何安全养虾? - 容器化部署龙虾
docker·qwen·openclaw·龙虾
Anesthesia丶4 天前
Qwen2.5-1.5b 模型部署与LORA训练笔记
pytorch·python·lora·llm·qwen·vllm
搬砖的前端7 天前
本地模型+TRAE CN 打造最优模型组合实测:开源主模型+本地辅模型,对标GPT5.2/5.3/Gemini-3-Flash
前端·ai·mac·ai编程·qwen·trae·qwen3.6
碳基硅坊8 天前
Mac Studio M3 Ultra 运行大模型实测:Qwen3.6 vs 6款主流模型工具调用对比
人工智能·qwen·qwen3.6
带娃的IT创业者8 天前
深度解析 Qwen3.6-35B-A3B:重塑 AI 编程代理的开源新标杆
人工智能·python·ai·开源·大模型·qwen·编程代理
mpr0xy9 天前
《AI怎么一步步变聪明的?》系列(六)中国大模型崛起之路:从“追赶者”到“解题人”
人工智能·ai·大语言模型·qwen·deepseek
熊猫钓鱼>_>15 天前
私有化AI视频助手搭建实录:当Ollama遇上OpenClaw
人工智能·音视频·agent·qwen·ollama·openclaw·happyhorse-1.0
Cachel wood15 天前
Macbook M4 pro本地部署大模型|Ollama+Gemma4/Qwen3.5
人工智能·python·自动化·llm·qwen·ollama·gemma4
dax eursir21 天前
Qwen3-VL-2B vs BLIP-2:轻量视觉模型部署效率对比分析
qwen·视觉语言模型·多模态ai·ocr识别