Celery的任务流
在之前调用任务的时候只是使用delay()和apply_async()方法。但是有时我们并不想简单的执行单个异步任务,比如说需要将某个异步任务的结果作为另一个异步任务的参数或者需要将多个异步任务并行执行,返回一组返回值,为了实现此目标,Celery使用一种叫做signatures的东西
signature的引入
可以简单理解为signature是将之前的异步任务以某种方式包装,包装后的异步任务仍可以使用之前的delay()和apply_async()方法,并且包装后的异步任务就可以以多种方式组合成复杂的工作流程
python
import time
import celery
broker = 'redis://127.0.0.1:6379/1'
backend = 'redis://127.0.0.1:6379/2'
app = celery.Celery('app', backend=backend, broker=broker)
# 加
@app.task
def add_num(a, b):
print(f'{a}+{b}')
time.sleep(3) # 做延时处理,方便后面查看任务执行顺序
c = a + b
return c
# 减
@app.task
def subtract_num(a, b):
print(f'{a}-{b}')
time.sleep(3) # 做延时处理,方便后面查看任务执行顺序
c = a - b
return c
# 乘
@app.task
def multiply_num(a, b):
print(f'{a}*{b}')
time.sleep(3) # 做延时处理,方便后面查看任务执行顺序
c = a * b
return c
# 除
@app.task
def divide_num(a, b):
print(f'{a}/{b}')
time.sleep(3) # 做延时处理,方便后面查看任务执行顺序
c = a / b
return c
@app.task
def test(args):
print(args)
return args
运行celery消费者
bash
# 格式为:celery -A app对象所在的文件 worker -l 日志级别 -Q 队列名称(也可以不指定,默认为celry)
celery -A tasks worker -l info -Q test
用signature对上面的add_num包装
python
from celery import signature
from tasks import add_num, subtract_num, multiply_num, divide_num
# 方法1
sign = add_num.signature((1, 1), queue='test')
ret = sign.delay()
print(ret.get())
# 方法2
sign = signature('tasks.add_num', (1, 1), queue='test')
ret = sign.delay()
print(ret.get())
# 方法3
sign = signature(add_num, (1, 1), queue='test')
ret = sign.delay()
print(ret.get())
chain的使用
chain可以将signature包装的任务函数一个一个执行,一个执行完将执行return结果传递给下一个任务函数
python
from celery import signature, chain
from tasks import add_num, subtract_num, multiply_num, divide_num
add_sign = signature(add_num, (6, 2), queue='test')
subtract_sign = signature(subtract_num, (2,), queue='test')
multiply_sign = signature(multiply_num, (2,), queue='test')
divide_sign = signature(divide_num, (2,), queue='test')
# 对某个数依次做加减乘除处理
chain1 = chain(add_sign, subtract_sign, multiply_sign, divide_sign)
ret = chain1.delay()
print(ret.get())
可以看到异步任务依次执行,并将上一个异步任务的结果作为参数传递给下一个,形成一个链条
group的使用
group可以将signature包装的任务函数并行执行,返回一组返回值
python
from celery import signature, chain, group
from tasks import add_num, subtract_num, multiply_num, divide_num
add_sign = signature(add_num, (6, 2), queue='test')
subtract_sign = signature(subtract_num, (6, 2), queue='test')
multiply_sign = signature(multiply_num, (6, 2), queue='test')
divide_sign = signature(divide_num, (6, 2), queue='test')
# 对某个数分别做加减乘除处理
group1 = group(add_sign, subtract_sign, multiply_sign, divide_sign)
ret = group1.delay()
print(ret.get())
#[8, 4, 12, 3.0]
可以看到相比于chain,group里的任务是同时执行
chord的使用
依赖一个group任务,group任务结束后,将所有子任务的返回值作为参数传递给chord的回调函数,即chord由group任务组与回调函数组成
上代码
python
from celery import signature, chain, group, chord
from tasks import add_num, subtract_num, multiply_num, divide_num, test
add_sign = signature(add_num, (6, 2), queue='test')
subtract_sign = signature(subtract_num, (6, 2), queue='test')
multiply_sign = signature(multiply_num, (6, 2), queue='test')
divide_sign = signature(divide_num, (6, 2), queue='test')
group1 = group(add_sign, subtract_sign, multiply_sign, divide_sign)
#包装test异步任务函数
test_sign = signature(test, queue='test')
c1 = chord(group1, test_sign)
c1.delay()
可以看出,在执行完加减乘除所有异步任务后,chord会将任务组的结果作为list交给test函数,这里的test有点像回调函数
PS:根据我的观察,chain,group,chord在执行完后都会返回一个任务id,其中chain的任务id为任务链里最后一个任务的id,group的任务id是一个临时的任务id(group任务都结束后就会消失),chord的任务id是回调函数的任务id。因此chain和chord在任务结束后,任务结果还是可以查到的,而group则查询不到,因此group的任务结果可能无法用AsyncResult查询到
最后附上celery关于任务工作流的官方链接
celery工作流
PS
有的时候我们可能需要在celery的task函数中调用其他的celery函数,并且需要同步的获取结果(其实着本质上就是把异步的celery函数变成同步运行),具体如下,先创建一个tasks.py
python
import time
import celery
broker = 'redis://127.0.0.1:6379/1'
backend = 'redis://127.0.0.1:6379/2'
app = celery.Celery('app', backend=backend, broker=broker)
# 加
@app.task
def add_num(a, b):
print(f'{a}+{b}')
time.sleep(3) # 做延时处理,方便后面查看任务执行顺序
c = a + b
return c
@app.task
def test():#在test函数里调用add_num函数,并且同步获取结果,将结果作为test函数的返回值
ret = add_num.delay(1,2)
ret = ret.get()
return ret
bash
#启动消费者
celery -A tasks worker -l info
调用test异步函数
bash
from tasks import test
ret = test.delay()
结果就是出错了,因为官方不建议在一个异步任务中区等待另一个异步任务的返回结果,所以这个时候就可以通过上面的chain方法实现这个需求。当然还有一种不建议的方法就是在同步获取celery任务结果的get方法中添加参数disable_sync_subtasks=False,具体如下
python
import time
import celery
broker = 'redis://127.0.0.1:6379/1'
backend = 'redis://127.0.0.1:6379/2'
app = celery.Celery('app', backend=backend, broker=broker)
# 加
@app.task
def add_num(a, b):
print(f'{a}+{b}')
time.sleep(3) # 做延时处理,方便后面查看任务执行顺序
c = a + b
return c
@app.task
def test():
ret = add_num.delay(1, 2)
ret = ret.get(disable_sync_subtasks=False)#在这添加disable_sync_subtasks=False
return ret
再调用一次test方法
成功调用
详见celery官方链接
链接传送门
结语
写这些,仅记录自己学习使用celery的过程。如果有什么错误的地方,还请大家批评指正。最后,希望小伙伴们都能有所收获。