千问Qwen7B chat:本地部署及网页端使用

基于前面的安装经验,千问大模型的本地部署并不算难,主要时间用在大模型文件的下载上。同时系统运行对硬件也有较高的要求,本机的硬件配置为N卡3060,显存12G。

  1. 使用conda创建虚拟环境,主要版本如下:

Python 3.9.18

CUDA 12.1

pytorch 2.2.2

  1. 克隆代码到本地

git clone https://github.com/QwenLM/Qwen.git

  1. 进入Qwen目录,执行安装命令

安装依赖

pip install -r requirements.txt

安装 web_demo 依赖

pip install -r requirements_web_demo.txt

  1. 运行命令

python web_demo.py --server-port 8087 --server-name "0.0.0.0"

会下载很多模型文件,需要一点时间。下载完成后启动界面如下

在输入框里输入沟通内容"你是谁"。我们看一下后台输出:

相关推荐
swipe5 小时前
Neo4j + Graph RAG 医疗知识图谱工程实践:患者教育问答真正需要的是“关系可追溯”
后端·langchain·llm
沐自礼8 小时前
DeepSeekMoE 原理
人工智能·llm
小新同学^O^11 小时前
简单学习 --> 指令微调
人工智能·学习·llm·指令微调
swipe11 小时前
混合检索 RAG 的工程化实践:不是多查几路,而是把召回、重排和上下文预算管好
后端·langchain·llm
创世宇图11 小时前
Claude Opus 4.8 深度实测:动态多 Agent 协同、Effort Control 与幻觉抑制的工程化解析
ai·llm·agent·claude·ai工程化
lhxcc_fly14 小时前
2.LangChain--聊天模型之流式传输
ai·langchain·llm·流式传输
隐层漫游者17 小时前
深度解密LangChain与RAG:从零构建智能衣答系统,掌握大模型本地知识库的终极奥义
llm
文歌子17 小时前
MCP 协议:AI 地学工具链的通用胶水
llm·mcp
lhxcc_fly18 小时前
3.LangChain组件--消息
langchain·llm·messages
虾..18 小时前
大模型认识
人工智能·llm·rag