千问Qwen7B chat:本地部署及网页端使用

基于前面的安装经验,千问大模型的本地部署并不算难,主要时间用在大模型文件的下载上。同时系统运行对硬件也有较高的要求,本机的硬件配置为N卡3060,显存12G。

  1. 使用conda创建虚拟环境,主要版本如下:

Python 3.9.18

CUDA 12.1

pytorch 2.2.2

  1. 克隆代码到本地

git clone https://github.com/QwenLM/Qwen.git

  1. 进入Qwen目录,执行安装命令

安装依赖

pip install -r requirements.txt

安装 web_demo 依赖

pip install -r requirements_web_demo.txt

  1. 运行命令

python web_demo.py --server-port 8087 --server-name "0.0.0.0"

会下载很多模型文件,需要一点时间。下载完成后启动界面如下

在输入框里输入沟通内容"你是谁"。我们看一下后台输出:

相关推荐
谢白羽3 小时前
SimpleMem:长期记忆不是存得更多,而是让每个 token 更有信息密度
大模型·llm·agent·agent memory
冬奇Lab4 小时前
Agent 系列(14):Agent 可观测性——追踪每一步决策,让黑盒变透明
人工智能·llm·agent
JouYY5 小时前
如何为基于 WebSocket 的 AI Agent 构建自动化测评系统
llm·agent·ai编程
webmote6 小时前
从零打造虚拟小智:用浏览器模拟 IoT 设备的实践之路
物联网·websocket·ai·大模型·llm·.net·小智
HLAIA光子6 小时前
LLM缓存机制:你的API账单可以砍掉75%
后端·llm·ai编程
dy_Alley7 小时前
从输入到决策:意图识别在 AI 架构中的定位与应用 — 第八章《知识检索 RAG-2》
llm
逻极10 小时前
Hermes Agent深度解析:从ReAct到多智能体系统架构实战
llm·agent·react·rag·多智能体系统
冬奇Lab20 小时前
Agent 系列(13):Agent 安全与防护——提示词注入、工具滥用、数据泄露怎么防
人工智能·llm·agent
装不满的克莱因瓶1 天前
学习并掌握 LangChain 检索器的作用,实现让 LLM 动态调用知识库功能
人工智能·python·ai·langchain·llm·agent·智能体
惟愿光怪陆离1 天前
OpenCode 注意事项
llm