千问Qwen7B chat:本地部署及网页端使用

基于前面的安装经验,千问大模型的本地部署并不算难,主要时间用在大模型文件的下载上。同时系统运行对硬件也有较高的要求,本机的硬件配置为N卡3060,显存12G。

  1. 使用conda创建虚拟环境,主要版本如下:

Python 3.9.18

CUDA 12.1

pytorch 2.2.2

  1. 克隆代码到本地

git clone https://github.com/QwenLM/Qwen.git

  1. 进入Qwen目录,执行安装命令

安装依赖

pip install -r requirements.txt

安装 web_demo 依赖

pip install -r requirements_web_demo.txt

  1. 运行命令

python web_demo.py --server-port 8087 --server-name "0.0.0.0"

会下载很多模型文件,需要一点时间。下载完成后启动界面如下

在输入框里输入沟通内容"你是谁"。我们看一下后台输出:

相关推荐
树獭非懒1 小时前
AI大模型小白手册|Embedding 与向量数据库
后端·python·llm
爱可生开源社区5 小时前
MiniMax M2.5 的 SQL 能力令人惊艳!
sql·llm
鞋带松了12 小时前
LangChain入门初体验-实现简单智能体
langchain·llm
孤烟12 小时前
【RAG 实战系列 02】检索精度翻倍!混合检索(稀疏 + 稠密)实战教程
人工智能·llm
xun_xing12 小时前
一篇文章让你彻底熟悉AI大模型(一)
llm·openai·ai编程
黄粱梦醒1 天前
大模型企业级部署方案-vllm
人工智能·llm
数据智能老司机1 天前
使用 MCP 与 A2A 设计多智能体 AI 系统——部署多智能体系统
llm·agent
DigitalOcean1 天前
GPU对比:MI350X、MI325X、MI300X、H200、H100
llm·aigc
数据智能老司机1 天前
使用 MCP 与 A2A 设计多智能体 AI 系统——与 Model Context Protocol(MCP)生态系统集成
llm·agent
数据智能老司机1 天前
使用 MCP 与 A2A 设计多智能体 AI 系统——构建一个基于工具的智能体 AI 框架
llm·agent