千问Qwen7B chat:本地部署及网页端使用

基于前面的安装经验,千问大模型的本地部署并不算难,主要时间用在大模型文件的下载上。同时系统运行对硬件也有较高的要求,本机的硬件配置为N卡3060,显存12G。

  1. 使用conda创建虚拟环境,主要版本如下:

Python 3.9.18

CUDA 12.1

pytorch 2.2.2

  1. 克隆代码到本地

git clone https://github.com/QwenLM/Qwen.git

  1. 进入Qwen目录,执行安装命令

安装依赖

pip install -r requirements.txt

安装 web_demo 依赖

pip install -r requirements_web_demo.txt

  1. 运行命令

python web_demo.py --server-port 8087 --server-name "0.0.0.0"

会下载很多模型文件,需要一点时间。下载完成后启动界面如下

在输入框里输入沟通内容"你是谁"。我们看一下后台输出:

相关推荐
CoderJia程序员甲1 天前
GitHub 热榜项目 - 日榜(2025-12-31)
开源·大模型·llm·github·ai教程
冬奇Lab1 天前
【Cursor进阶实战·03】四大模式完全指南:Agent/Plan/Debug/Ask的正确打开方式
llm·ai编程·cursor
Mintopia1 天前
⚙️ AI冲击下的职场新物种:超级个体
人工智能·llm·aigc
爱听歌的周童鞋1 天前
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 17: Alignment - RL 2
llm·policy gradient·grpo·cs336·baselines·advantage funcs
牛奶咖啡.8542 天前
基于Llama-Factory/Qwen2.5-1.5b自定义数据集LoRA微调实战【PPO/RLHF/训练/评估】
语言模型·llm·llama·rl·ppo
人工干智能2 天前
LLM大模型的付费管理流程(以OpenAI 为例)
llm
智泊AI2 天前
大语言模型之AI Agent:Multi-Agent架构
llm
Mintopia2 天前
量子计算会彻底改变 AI 的运算方式吗?一场关于"量子幽灵"与"硅基大脑"的深夜对话 🎭💻
人工智能·llm·aigc
mubei-1232 天前
Self-RAG:通过自我反思学习检索、生成和批判
人工智能·llm·rag·检索增强生成
hzp6662 天前
招牌红烧肉版-深度神经网络
人工智能·深度学习·神经网络·llm·aigc·dnn·反向传播