千问Qwen7B chat:本地部署及网页端使用

基于前面的安装经验,千问大模型的本地部署并不算难,主要时间用在大模型文件的下载上。同时系统运行对硬件也有较高的要求,本机的硬件配置为N卡3060,显存12G。

  1. 使用conda创建虚拟环境,主要版本如下:

Python 3.9.18

CUDA 12.1

pytorch 2.2.2

  1. 克隆代码到本地

git clone https://github.com/QwenLM/Qwen.git

  1. 进入Qwen目录,执行安装命令

安装依赖

pip install -r requirements.txt

安装 web_demo 依赖

pip install -r requirements_web_demo.txt

  1. 运行命令

python web_demo.py --server-port 8087 --server-name "0.0.0.0"

会下载很多模型文件,需要一点时间。下载完成后启动界面如下

在输入框里输入沟通内容"你是谁"。我们看一下后台输出:

相关推荐
AlfredZhao4 小时前
一篇搞定:用 curl 测试私有部署模型联通性
llm·embedding·model·curl
Darling噜啦啦13 小时前
拆解 LLM 的内部黑盒:从 Token 到 Self-Attention 的逐层解码之旅
llm·aigc
武子康17 小时前
调查研究-209 Apptronik Robot Park 深度解析:人形机器人竞争,开始拼“真实世界数据工厂“
人工智能·google·llm
DigitalOcean1 天前
DigitalOcean 推出大模型自动化评估功能,上线前精准避坑
llm·agent
ch_09182 天前
从0构建SDK第3节:实现 ReActAgent 的推理与行动循环
typescript·llm·agent
得物技术2 天前
AI UITester:AI Native 的 UI 自动化测试新范式|得物技术
llm·aigc·测试
不好听6132 天前
Harness Engineering:给千里马套上缰绳
llm·agent
小林ixn2 天前
LLM如何预测下一个词?从Token到概率,一文看懂大模型推理内幕
人工智能·llm
树獭非懒2 天前
从零构建ReAct智能体:让AI学会边想边做
人工智能·llm·agent