千问Qwen7B chat:本地部署及网页端使用

基于前面的安装经验,千问大模型的本地部署并不算难,主要时间用在大模型文件的下载上。同时系统运行对硬件也有较高的要求,本机的硬件配置为N卡3060,显存12G。

  1. 使用conda创建虚拟环境,主要版本如下:

Python 3.9.18

CUDA 12.1

pytorch 2.2.2

  1. 克隆代码到本地

git clone https://github.com/QwenLM/Qwen.git

  1. 进入Qwen目录,执行安装命令

安装依赖

pip install -r requirements.txt

安装 web_demo 依赖

pip install -r requirements_web_demo.txt

  1. 运行命令

python web_demo.py --server-port 8087 --server-name "0.0.0.0"

会下载很多模型文件,需要一点时间。下载完成后启动界面如下

在输入框里输入沟通内容"你是谁"。我们看一下后台输出:

相关推荐
Lkstar4 小时前
高级提示技巧:Few-shot、Chain-of-Thought、自一致性——让大模型推理能力翻倍
程序员·llm·ai编程
qq_白羊座5 小时前
DeepEval vs EvalScope 完整对比
llm
AlfredZhao5 小时前
AI编程系列01:裸 API 账单场景下,如何自建 LLM 用量可视化看板
llm·vibecoding·氛围编程
CoderJia程序员甲7 小时前
GitHub 热榜项目 - 周榜(2026-05-31)
ai·大模型·llm·github·ai教程
老A的AI实验室10 小时前
Cyber Weekly #66
人工智能·ai·llm·agi·genai
AndrewHZ12 小时前
【LLM技术全景】Transformer架构深度解析:Encoder-Decoder全理解
人工智能·深度学习·语言模型·大模型·llm·transformer·编解码技术
阿昌喜欢吃黄桃12 小时前
大模型常见参数学习笔记
人工智能·ai·llm·prompt·token
把你拉进白名单12 小时前
4.OpenClaw源码解析_路由
llm·agent
lhxcc_fly13 小时前
5.LangChain--输出解析器
langchain·llm·输出解析器
花花少年15 小时前
Ubuntu系统下安装Claude Code
llm·agent·claude code