千问Qwen7B chat:本地部署及网页端使用

基于前面的安装经验,千问大模型的本地部署并不算难,主要时间用在大模型文件的下载上。同时系统运行对硬件也有较高的要求,本机的硬件配置为N卡3060,显存12G。

  1. 使用conda创建虚拟环境,主要版本如下:

Python 3.9.18

CUDA 12.1

pytorch 2.2.2

  1. 克隆代码到本地

git clone https://github.com/QwenLM/Qwen.git

  1. 进入Qwen目录,执行安装命令

安装依赖

pip install -r requirements.txt

安装 web_demo 依赖

pip install -r requirements_web_demo.txt

  1. 运行命令

python web_demo.py --server-port 8087 --server-name "0.0.0.0"

会下载很多模型文件,需要一点时间。下载完成后启动界面如下

在输入框里输入沟通内容"你是谁"。我们看一下后台输出:

相关推荐
树獭非懒10 小时前
Claude Code 完全入门指南:让你的 AI 从"会说"到"会做"
人工智能·程序员·llm
sg_knight12 小时前
第一次用 OpenClaw,我让它 3 分钟写了个小工具
算法·llm·agent·ai编程·openclaw
冬奇Lab13 小时前
RAG 系列(十二):高级分块策略——Parent-Child 与 Contextual Retrieval
人工智能·llm·源码
CV-deeplearning1 天前
太强了!NarratoAI:一键 AI 影视解说+自动剪辑,10分钟视频成本仅0.1元
llm·tts·自动剪辑·narratoai·ai影视解说
冬奇Lab1 天前
RAG 系列(十一):Rerank——让检索结果按重要性排队
人工智能·llm·源码
handsomestWei1 天前
OpenAI 与 Anthropic 接口协议差异简述
大模型·llm·openai·模型接口
JavaEdge在掘金1 天前
13-一文讲透 LangChain Memory:LLMChain、ConversationChain、CombinedMemory 与 RAG 实战
llm
雮尘1 天前
让AI更懂你:提示词工程5大框架完全指南
人工智能·llm
胡哈1 天前
Langfuse JavaScript SDK 架构设计与实现原理
llm·aigc·agent
曲幽1 天前
初探:用 FastAPI 搭建你的第一个 AI Agent 接口
python·ai·llm·agent·fastapi·web·chat·httpx·ollama