千问Qwen7B chat:本地部署及网页端使用

基于前面的安装经验,千问大模型的本地部署并不算难,主要时间用在大模型文件的下载上。同时系统运行对硬件也有较高的要求,本机的硬件配置为N卡3060,显存12G。

  1. 使用conda创建虚拟环境,主要版本如下:

Python 3.9.18

CUDA 12.1

pytorch 2.2.2

  1. 克隆代码到本地

git clone https://github.com/QwenLM/Qwen.git

  1. 进入Qwen目录,执行安装命令

安装依赖

pip install -r requirements.txt

安装 web_demo 依赖

pip install -r requirements_web_demo.txt

  1. 运行命令

python web_demo.py --server-port 8087 --server-name "0.0.0.0"

会下载很多模型文件,需要一点时间。下载完成后启动界面如下

在输入框里输入沟通内容"你是谁"。我们看一下后台输出:

相关推荐
晨欣7 小时前
Claude Opus 4.8:模型小幅升级,平台大步向前
llm·claude·anthropic·claude code·harness
lhxcc_fly10 小时前
6.LangChain--RAG
langchain·llm·rag
lhxcc_fly10 小时前
6.1RAG--文档加载器
langchain·llm·rag
AINative软件工程10 小时前
LLM 推理成本工程:从 Token 计量到分层路由的生产降本实践
llm
dy_Alley14 小时前
从输入到决策:意图识别在 AI 架构中的定位与应用 — 第六章《置信度决策路由》
llm
dy_Alley14 小时前
从输入到决策:意图识别在 AI 架构中的定位与应用 — 第七章《集成与组装》
llm
codefan※14 小时前
干掉幻觉实战:如何构建企业级知识图谱增强 RAG
人工智能·大模型·llm·知识图谱·neo4j·rag·graphrag
摸鱼同学15 小时前
LLM 是什么?从 API 调用到 Token 机制
ai·大模型·llm·token·claudecode
小锋学长生活大爆炸17 小时前
【培训】Agent与OpenClaw
llm·agent·教程·科普·知识·培训·openclaw
Lkstar1 天前
高级提示技巧:Few-shot、Chain-of-Thought、自一致性——让大模型推理能力翻倍
程序员·llm·ai编程