mac本地部署Qwq-32b记录

导语

昨天看到阿里开源了Qwq-32b,号称性能可以媲美Deepseek-R1。今天晚上有空就在Mac上折腾了一下,使用ollma进行了部署,效果感觉还不错,特此记录。

环境

硬件

  • 型号:Macbook M1 Pro 14寸
  • 内存:512G

环境配置

首先需要安装ollama,直接前往Ollama官网下载对应系统版本安装包并进行安装即可。

之后,打开命令行(mac是zsh),输入

bash 复制代码
jiexing@MacBook-M1-Pro ~ % ollama run qwq
pulling manifest 
pulling c62ccde5630c... 100% ▕█████████████████████████████████████████████████████████████████████████████████████████████████████▏  19 GB                         
pulling 41190096a061... 100% ▕█████████████████████████████████████████████████████████████████████████████████████████████████████▏ 1.2 KB                         
pulling d18a5cc71b84... 100% ▕█████████████████████████████████████████████████████████████████████████████████████████████████████▏  11 KB                         
pulling 4afe5edfdb51... 100% ▕█████████████████████████████████████████████████████████████████████████████████████████████████████▏   77 B                         
pulling 6a8faa2fb8b0... 100% ▕█████████████████████████████████████████████████████████████████████████████████████████████████████▏  488 B                         
verifying sha256 digest 
writing manifest 
success 
>>> 请介绍一下你自己
<think>

</think>

你好!我是通义千问,阿里巴巴集团旗下的超大规模语言模型。我可以帮助你回答问题、创作文字,比如写故事、写公文、写邮件、写剧本,进行逻辑推理、编程等。我熟练掌握多种语言,包括但不限于中文、英文、德语、法语、西班牙语等。

如果你有任何问题或需要帮助,欢迎随时告诉我!

WebUI搭建

完成部署后,看着简陋的命令行背景,感觉还是不如chatgpt、Deepseek那些网页版体验好,于是找了一下如何部署一个Web UI。主要参考ollama-webui-lite项目,尝试如下:

首先需要clone项目:

复制代码
git clone https://github.com/ollama-webui/ollama-webui-lite.git
cd ollama-webui-lite

然后运行

复制代码
yarn

结果我这里报错

复制代码
zsh command not found yarn

于是我使用brew来安装yarn,直接brew install yarn是无法成功的,经过搜索发现需要更新brew update,然后顺利安装yarn。

在运行之前,还需要确保本机的node>=16,可以直接使用
brew install node来安装。

启动界面

在项目目录下,运行yarn dev,即可成功设置WebUI,点击 http://localhost:3000/ 即可打开本地的WebUI。

bash 复制代码
jiexing@MacBook-M1-Pro ollama-webui-lite % yarn dev
yarn run v1.22.22
$ vite dev --host --port 3000

Forced re-optimization of dependencies

  VITE v4.5.9  ready in 499 ms

  ➜  Local:   http://localhost:3000/
  ➜  Network: http://192.168.71.174:3000/
  ➜  Network: http://10.50.50.18:3000/
  ➜  press h to show help
相关推荐
HackTorjan3 小时前
2026年5月29日:全球首个通用人工智能操作系统正式发布,开启人机协同新纪元
人工智能
刘大猫.3 小时前
智造短剧新引擎:火山引擎上线「火山剧创 1.0」,制作效率提升 80%
人工智能·ai·chatgpt·机器人·大模型·火山引擎·短剧新引擎
红尘散仙4 小时前
我把终端小说阅读器接上了 AI Agent:TRNovel 现在能用 skill 生成书源了
人工智能·后端·rust
雅菲奥朗4 小时前
企业级 AI 自动化|OpenClaw 龙虾实战与认证
运维·人工智能·自动化·openclaw
HIT_Weston4 小时前
99、【Agent】【OpenCode】task 工具提示词(Slash command)(一)
人工智能·agent·opencode
25 Hz4 小时前
Mind 爱好者时空表征刊 第24期 | 时间结构学习、空间对时间表征的补偿、事件内部的时间扭曲……
人工智能
心中有国也有家4 小时前
GE图引擎深度解析——CANN的计算图优化与执行引擎
人工智能·pytorch·python·学习·numpy
海兰4 小时前
【文字三国志:第一篇】天命重构,大语言模型(LLM)动态生成文言风格的叙事文本的文字游戏
人工智能·游戏·语言模型
cxr8285 小时前
高分子复合材料 AI 逆向设计合——验证闭环、决策优化与中试放大
人工智能·材料逆向设计合成
litble5 小时前
如何速成LLM以伪装成一个AI研究者(6)——LoRA,Adapter,P-tuning,量化,QLoRA
人工智能·lora·量化·peft·qlora·高效微调