celery solo acks_late得不到预期

复现版本

celery <= 5.5.3

背景

使用pycharm配置启动celery得不到预期

现在剩下qwe

然后强制关闭然后他重放队列

结论

跟solo有关 这个代码kombu会将一个"发送 ACK"的命令放入其内部的发送缓冲区,不会马上发送

solo的工作模式:

  1. 从消息队列(MQ)获取消息。
  2. 处理任务的元数据。
  3. 执行任务函数本身。
  4. 与 MQ 进行通信(如发送 ACK)

当使用 acks_late=False (默认设置) 时,Celery 的内部流程:

  1. 获取消息:Solo Worker 的主循环从 MQ (如 RabbitMQ) 获取了一条消息。
  2. 准备执行:Worker 解析消息,准备调用您的任务函数。
  3. 调用 early ack:代码执行到 if not self.task.acks_late: self.acknowledge()。此时,Celery 的网络库( kombu)会将一个"发送 ACK"的命令放入其内部的发送缓冲区。
  4. 执行任务代码:Worker 立即开始执行您的任务代码。假设您的任务里有 time.sleep(100)。
  5. 关键点:线程阻塞:time.sleep(100) 是一个同步阻塞操作。因为它运行在 Worker 唯一的主线程中,所以它会冻结整个 Worker。在这个时候,主线程被 sleep 占据,完全无法去做其他任何事情,包括处理网络I/O缓冲区、发送之前准备好的 ACK 命令。
  6. MQ 等待 ACK:在 RabbitMQ 的视角里,它已经将消息投递给了消费者,但迟迟没有收到 ACK 回复。因此,它正确地将这条消息保持在 unacked 状态。
  7. 任务结束:100 秒后,time.sleep(100) 结束,您的任务函数返回。
  8. 恢复 I/O:现在,主线程的控制权回到了 Celery Worker 的主循环中。它终于有空去处理它的网络I/O缓冲区了。
  9. 发送 ACK:Worker 这时才真正地通过网络连接,将第 3 步中准备好的 ACK 命令发送给 RabbitMQ。
  10. MQ 确认消息:RabbitMQ 收到 ACK,于是从 unacked 状态中移除该消息。

在处理任务函数时被阻塞住了所以不发送ack,直到执行结束才发送ack

这个时候又分为2个得不到预期的情况:

  1. 终端直接使用命令启动:非正常结束不管配置acks_late是什么消息都丢失 如果worker正在消费,然后连续ctrl+c会报错,因为solo没有实现关闭任务


    NotImplementedError: <class 'celery.concurrency.solo.TaskPool'> does not implement kill_job

  2. 使用pycharm配置命令启动:非正常结束不管配置acks_late是什么消息都塞回队列可以重新消费

prefork工作模式:

  • 主进程:负责从 MQ 获取消息和处理网络 I/O(包括发送 ACK)。
  • 子进程池:负责真正执行任务代码。

流程会变成:

  1. 主进程从 MQ 获取消息。
  2. 主进程看到 acks_late=False,于是立即通过自己的网络连接发送 ACK 给 MQ。由于主进程不执行任务代码,它不会被阻塞。
  3. MQ 几乎瞬间收到 ACK,并将消息从 unacked 队列移除。
  4. 主进程将任务的执行工作分派给一个空闲的子进程。
  5. 子进程开始执行 time.sleep(100)。这只会阻塞子进程自己,完全不影响主进程继续从 MQ 获取新任务和发送 ACK。

所以及时在-c 1也可以处理其他信息,包括celery -A config inspect reserved等在使用solo进程worker在消费时无法执行其他命令

相关issue:

从工作模式看我觉得是可以接受的,但是celery的开发者好像觉得是个bug等待有缘人修复
https://github.com/celery/celery/issues/5935

相关推荐
梦想画家5 小时前
基于PyTorch的时间序列异常检测管道构建指南
人工智能·pytorch·python
PythonFun6 小时前
OCR图片识别翻译工具功能及源码
python·ocr·机器翻译
虫师c7 小时前
Python浪漫弹窗程序:Tkinter实现动态祝福窗口教程
python·tkinter·动画效果·gui编程·弹窗效果
灯火不休时8 小时前
95%准确率!CNN交通标志识别系统开源
人工智能·python·深度学习·神经网络·cnn·tensorflow
deephub8 小时前
FastMCP 入门:用 Python 快速搭建 MCP 服务器接入 LLM
服务器·人工智能·python·大语言模型·mcp
南宫乘风9 小时前
基于 Flask + APScheduler + MySQL 的自动报表系统设计
python·mysql·flask
番石榴AI9 小时前
基于机器学习优化的主图选择方法(酒店,景点,餐厅等APP上的主图展示推荐)
图像处理·人工智能·python·机器学习
qq7422349849 小时前
Python操作数据库之pyodbc
开发语言·数据库·python
2401_8414956410 小时前
【自然语言处理】轻量版生成式语言模型GPT
人工智能·python·gpt·深度学习·语言模型·自然语言处理·transformer
云和数据.ChenGuang10 小时前
tensorflow生成随机数和张量
人工智能·python·tensorflow