本地部署DeepSeek-R1(Dify压力测试和性能调优)

安装压测软件

为了有效测试,应在局域网设备测试,我这里用的服务器是局域网内的Ubuntu,下载的压测软件是WRK

复制代码
apt install wrk

测试脚本

为了省事我直接在/root目录下新建lua脚本

复制代码
vim test.lua

脚本内容如下,app-xxxx更换为你工作流的API密钥

复制代码
wrk.method = "POST"
wrk.body = '{"inputs":{"query":"1"},"response_mode":"streaming","user":"dcf压测"}'
wrk.headers["Content-Type"] = "application/json"
wrk.headers["Authorization"] = "Bearer app-08mesPqsdYfybwN6iIjyVcji"

新建测试工作流

这里只新建了个空的工作流直接返回user_id,不加大模型,加上模型有其他延迟

API密钥在检测里面创建

开始压测

测试命令

复制代码
wrk -t50 -c200 -d20s -s test.lua --timeout 10s --latency http://192.168.11.119/v1/workflows/run

【测试20线程,200个链接,持续20秒,持续请求工作流10秒】

平均延迟:251.70毫秒,最大延迟:1.79秒,QPS:每秒851次

性能调优

修改工作进程数量参数SERVER_WORKER_AMOUNT,默认为1,官方参考公式:cpu核数*2+1。

我这里是CPU64核,256G内存,试了一下调成129,Dify有点动不了,然后我改成了65(每次修改.env文件参数需重启Dify)

#将默认的1参数改大,参考cpu核数*2+1

复制代码
SERVER_WORKER_AMOUNT=65

再压测一下,明显快了很多

性能上来了,但是返现Dify里面的所有应用会提示报错:Internal Server Error

同时返回了很多非2XX和3XX响应,还需要修改连接池数量参数,避免超过连接数

我这里将SQLALCHEMY_POOL_SIZE、POSTGRES_MAX_CONNECTIONS、SQLALCHEMY_MAX_OVERFLOW三个参数全部调到了3000,默认30、100能不超过吗。

复制代码
SQLALCHEMY_POOL_SIZE=3000
POSTGRES_MAX_CONNECTIONS=3000
#注意默认.env配置文件里没有SQLALCHEMY_MAX_OVERFLOW这个参数,需手动添加
SQLALCHEMY_MAX_OVERFLOW=3000

重启Dify再测试,测一次1700+个对话

相关推荐
realhuizhu17 分钟前
周报写了2小时还被挑刺?试试这个AI生成框架
ai提示词·deepseek·工作周报·职场效率·周报生成器
芥子沫34 分钟前
《玩转Docker》[应用篇13]:Docker安装部署Emby及使用技巧:家庭媒体服务器
docker·视频·emby
爱宇阳2 小时前
从容器化到自动化:Spring Boot 项目 Docker 部署与 GitLab CI/CD 集成 Harbor 全流程
spring boot·docker·自动化
PKNLP4 小时前
07.docker介绍与常用命令
运维·docker·容器
l1t5 小时前
利用DeepSeek采用hugeint转字符串函数完善luadbi-duckdb的decimal处理
数据库·lua·c·duckdb·deepseek
人工智能训练5 小时前
在ubuntu系统中如何将docker安装在指定目录
linux·运维·服务器·人工智能·ubuntu·docker·ai编程
大模型教程6 小时前
30分钟内搞定!在本地电脑上部署属于你自己的大模型
llm·agent·ollama
爱宇阳6 小时前
Java Spring Boot 项目 Docker 容器化部署教程
java·spring boot·docker
掘根6 小时前
【Docker】网络
网络·docker·容器
Mr.Lee jack6 小时前
【CUDA 编程思想】FwdKvcacheMla 算子详细数据流程讲解
deepseek