gunicorn + flask 处理高并发请求

一、核心架构

​​Flask:局限于单线程 WSGI 应用框架,默认仅能顺序处理请求,无法直接并发。

Gunicorn:多进程模型​​,通过预派生(pre-fork)机制启动多个 Worker 进程(-w参数),每个 Worker 独立处理请求,充分利用多核 CPU。

  • I/O 密集型场景:使用协程模式(-k gevent),单进程内通过事件循环处理数千并发连接。
  • CPU 密集型场景:使用多线程(-k gthread)或同步 Worker(sync)。

二、关键配置

  1. Worker 数量与类型
  • 进程数公式:Worker 数 = (CPU 核心数 × 2) + 1(例:4 核 CPU → 9 Workers)。
  • 协程并发数:通过 --worker-connections 调整单个 Worker 的协程池大小(默认 1000,可增至 2000 ~ 5000)。
  1. 资源限制与稳定性
  • 超时控制:--timeout 30 防止慢请求阻塞 Worker,--graceful-timeout 30确保安全重启。
  • 内存优化:启用 --preload预加载代码,减少多进程内存占用。设置 --max-requests 1000 定期重启 Worker,避免内存泄漏。
  • 反向代理(Nginx):负载均衡:Nginx 分发请求至多个 Gunicorn 实例(监听不同端口),避免单点瓶颈。静态文件与缓存:Nginx 直接处理静态资源,减少 Flask 压力;启用 proxy_cache 缓存动态内容。

​​三、优化策略​

  1. 异步任务处理耗时操作(邮件发送、数据处理)用 Celery + Redis 异步执行,释放请求线程。
  2. 数据库与缓存
  • 连接池:SQLAlchemy 配置 pool_size=20 复用数据库连接。
  • Redis 缓存:高频查询结果缓存,减少数据库访问。
  1. 实时通信优化 WebSocket 场景(如聊天室)使用 Flask-SocketIO + eventlet,替代 HTTP 轮询。

四、部署监控

  1. 容器化部署(Docker):打包应用依赖,确保环境一致性,Docker Compose 管理多实例水平扩展。
  2. 性能监控:Gunicorn 配置 accesslog 和 errorlog 跟踪请求与错误。Prometheus + Grafana 监控内存 / CPU 使用,定位瓶颈。

五、最佳实践

  1. 基础架构:Nginx(负载均衡) + Gunicorn(进程/协程管理) + Flask(业务逻辑)。
  2. 扩展能力:
  • 垂直扩展:增加 Worker 数 / 协程连接数。
  • 水平扩展:通过 Docker 部署多容器实例。
  1. 适用场景:
    I/O 密集型:Gevent Worker + 高 worker-connections。
    CPU 密集型:多进程 + 线程池(gthread)。
相关推荐
薛定谔的猫喵喵8 小时前
天然气压力能利用系统综合性评价平台:基于Python和PyQt5的AHP与模糊综合评价集成应用
开发语言·python·qt
yuluo_YX8 小时前
Reactive 编程 - Java Reactor
java·python·apache
独好紫罗兰8 小时前
对python的再认识-基于数据结构进行-a004-列表-实用事务
开发语言·数据结构·python
ZH15455891318 小时前
Flutter for OpenHarmony Python学习助手实战:模块与包管理的实现
python·学习·flutter
choke2338 小时前
[特殊字符] Python异常处理
开发语言·python
玄同7659 小时前
从 0 到 1:用 Python 开发 MCP 工具,让 AI 智能体拥有 “超能力”
开发语言·人工智能·python·agent·ai编程·mcp·trae
小瑞瑞acd9 小时前
【小瑞瑞精讲】卷积神经网络(CNN):从入门到精通,计算机如何“看”懂世界?
人工智能·python·深度学习·神经网络·机器学习
火车叼位10 小时前
也许你不需要创建.venv, 此规范使python脚本自备依赖
python
火车叼位10 小时前
脚本伪装:让 Python 与 Node.js 像原生 Shell 命令一样运行
运维·javascript·python
孤狼warrior10 小时前
YOLO目标检测 一千字解析yolo最初的摸样 模型下载,数据集构建及模型训练代码
人工智能·python·深度学习·算法·yolo·目标检测·目标跟踪