celery solo acks_late得不到预期

复现版本

celery <= 5.5.3

背景

使用pycharm配置启动celery得不到预期

现在剩下qwe

然后强制关闭然后他重放队列

结论

跟solo有关 这个代码kombu会将一个"发送 ACK"的命令放入其内部的发送缓冲区,不会马上发送

solo的工作模式:

  1. 从消息队列(MQ)获取消息。
  2. 处理任务的元数据。
  3. 执行任务函数本身。
  4. 与 MQ 进行通信(如发送 ACK)

当使用 acks_late=False (默认设置) 时,Celery 的内部流程:

  1. 获取消息:Solo Worker 的主循环从 MQ (如 RabbitMQ) 获取了一条消息。
  2. 准备执行:Worker 解析消息,准备调用您的任务函数。
  3. 调用 early ack:代码执行到 if not self.task.acks_late: self.acknowledge()。此时,Celery 的网络库( kombu)会将一个"发送 ACK"的命令放入其内部的发送缓冲区。
  4. 执行任务代码:Worker 立即开始执行您的任务代码。假设您的任务里有 time.sleep(100)。
  5. 关键点:线程阻塞:time.sleep(100) 是一个同步阻塞操作。因为它运行在 Worker 唯一的主线程中,所以它会冻结整个 Worker。在这个时候,主线程被 sleep 占据,完全无法去做其他任何事情,包括处理网络I/O缓冲区、发送之前准备好的 ACK 命令。
  6. MQ 等待 ACK:在 RabbitMQ 的视角里,它已经将消息投递给了消费者,但迟迟没有收到 ACK 回复。因此,它正确地将这条消息保持在 unacked 状态。
  7. 任务结束:100 秒后,time.sleep(100) 结束,您的任务函数返回。
  8. 恢复 I/O:现在,主线程的控制权回到了 Celery Worker 的主循环中。它终于有空去处理它的网络I/O缓冲区了。
  9. 发送 ACK:Worker 这时才真正地通过网络连接,将第 3 步中准备好的 ACK 命令发送给 RabbitMQ。
  10. MQ 确认消息:RabbitMQ 收到 ACK,于是从 unacked 状态中移除该消息。

在处理任务函数时被阻塞住了所以不发送ack,直到执行结束才发送ack

这个时候又分为2个得不到预期的情况:

  1. 终端直接使用命令启动:非正常结束不管配置acks_late是什么消息都丢失 如果worker正在消费,然后连续ctrl+c会报错,因为solo没有实现关闭任务


    NotImplementedError: <class 'celery.concurrency.solo.TaskPool'> does not implement kill_job

  2. 使用pycharm配置命令启动:非正常结束不管配置acks_late是什么消息都塞回队列可以重新消费

prefork工作模式:

  • 主进程:负责从 MQ 获取消息和处理网络 I/O(包括发送 ACK)。
  • 子进程池:负责真正执行任务代码。

流程会变成:

  1. 主进程从 MQ 获取消息。
  2. 主进程看到 acks_late=False,于是立即通过自己的网络连接发送 ACK 给 MQ。由于主进程不执行任务代码,它不会被阻塞。
  3. MQ 几乎瞬间收到 ACK,并将消息从 unacked 队列移除。
  4. 主进程将任务的执行工作分派给一个空闲的子进程。
  5. 子进程开始执行 time.sleep(100)。这只会阻塞子进程自己,完全不影响主进程继续从 MQ 获取新任务和发送 ACK。

所以及时在-c 1也可以处理其他信息,包括celery -A config inspect reserved等在使用solo进程worker在消费时无法执行其他命令

相关issue:

从工作模式看我觉得是可以接受的,但是celery的开发者好像觉得是个bug等待有缘人修复
https://github.com/celery/celery/issues/5935

相关推荐
小蕾Java2 小时前
Python详细安装教程(附PyCharm使用)
开发语言·python·pycharm
weixin_307779132 小时前
使用AWS IAM和Python自动化权限策略分析与导出
开发语言·python·自动化·云计算·aws
惜月_treasure2 小时前
从零构建私域知识库问答机器人:Python 全栈实战(附完整源码)
开发语言·python·机器人
哈里谢顿3 小时前
threading模块学习
python
mit6.8243 小时前
[VoiceRAG] Azure | 使用`azd`部署应用 | Dockerfile
python
砥锋3 小时前
计算机人的雷达入门:零基础用Python+Cinrad可视化雷达数据【实战指南】
python
你们瞎搞4 小时前
arcgis矢量数据转为标准geojson格式
python·arcgis·json·地理空间数据
郝学胜-神的一滴4 小时前
Python中的鸭子类型:理解动态类型的力量
开发语言·python·程序人生·软件工程
2401_841495644 小时前
【计算机视觉】霍夫变换函数的参数调整
人工智能·python·算法·计算机视觉·霍夫变换·直线检测·调整策略
猫头虎4 小时前
如何解决 pip install -r requirements.txt extras 语法 ‘package[extra’ 缺少 ‘]’ 解析失败问题
开发语言·python·开源·beautifulsoup·virtualenv·pandas·pip