千问Qwen7B chat:本地部署及网页端使用

基于前面的安装经验,千问大模型的本地部署并不算难,主要时间用在大模型文件的下载上。同时系统运行对硬件也有较高的要求,本机的硬件配置为N卡3060,显存12G。

  1. 使用conda创建虚拟环境,主要版本如下:

Python 3.9.18

CUDA 12.1

pytorch 2.2.2

  1. 克隆代码到本地

git clone https://github.com/QwenLM/Qwen.git

  1. 进入Qwen目录,执行安装命令

安装依赖

pip install -r requirements.txt

安装 web_demo 依赖

pip install -r requirements_web_demo.txt

  1. 运行命令

python web_demo.py --server-port 8087 --server-name "0.0.0.0"

会下载很多模型文件,需要一点时间。下载完成后启动界面如下

在输入框里输入沟通内容"你是谁"。我们看一下后台输出:

相关推荐
CV-deeplearning2 小时前
太强了!NarratoAI:一键 AI 影视解说+自动剪辑,10分钟视频成本仅0.1元
llm·tts·自动剪辑·narratoai·ai影视解说
冬奇Lab3 小时前
RAG 系列(十一):Rerank——让检索结果按重要性排队
人工智能·llm·源码
handsomestWei3 小时前
OpenAI 与 Anthropic 接口协议差异简述
大模型·llm·openai·模型接口
JavaEdge在掘金5 小时前
13-一文讲透 LangChain Memory:LLMChain、ConversationChain、CombinedMemory 与 RAG 实战
llm
雮尘6 小时前
让AI更懂你:提示词工程5大框架完全指南
人工智能·llm
胡哈8 小时前
Langfuse JavaScript SDK 架构设计与实现原理
llm·aigc·agent
曲幽11 小时前
初探:用 FastAPI 搭建你的第一个 AI Agent 接口
python·ai·llm·agent·fastapi·web·chat·httpx·ollama
高木木的博客11 小时前
数字架构智能化测试平台(2)--AI DevOps测试流程框架
python·llm·fastapi·cicd
devpotato12 小时前
人工智能(十四)- 思维链(Chain of Thought, CoT)
人工智能·llm
@atweiwei13 小时前
LangChainRust Agent 引擎:Graph 构建到执行
rust·langchain·llm·agent·rag·langchaingraph