相关lc链接:rgw:lifecycle功能理解_ceph rgw lifecycle-CSDN博客
相关gc链接:RGW 的GC深入解析与调优-腾讯云开发者社区-腾讯云
每个rgw实例有rgw_lc_max_worker个worker (默认为3)来做lifecycle
RGWLC::LCWorker::entry()
-> RGWLC::process() // 1天只执行1次,(如果rgw_lc_debug_interval>0,只要超过了该时间,就视为没有执行过,会继续执行)
-> l.lock_exclusive()
-> cls_rgw_lc_get_head() // 获取对象head,拿到marker
-> cls_rgw_lc_get_entry() // 获取当前omap entry的状态
-> cls_rgw_lc_get_next_entry() // 获取下一个omap entry
-> cls_rgw_lc_set_entry() // 设置entry 状态
-> cls_rgw_lc_put_head() // 设置head的marker
-> l.unlock()
-> bucket_lc_process() // 处理lifecycle 任务
-> ol.get_obj() // 会借助LCObjLister去list objects, 然后将符合条件的bucket包装成对应的LCOpRule放入workpool,进而有worker来处理
-> op_rule.process() // worker会调用注册的process函数,LCOpRule::process调用LCOpAction->process对于当前版本过期删实际会调用LCOpAction_CurrentExpiration::process()
-> remove_expired_obj()
-> del_op.delete_obj() // 实际会抽象一个删除cephrgw object的类RGWRados::Object::Delete完成对象的删除流程,因为对象的删除是一个多阶段的流程,里面会涉及标记对象状态,同时将对象记录到default.rgw.log中的gc.x对象队列中
-> store->set_olh() // 处理.rgw.buckets.index 的状态
-> bucket_index_link_olh() // 更新.rgw.buckets.index中对象索引的状态,确保业务不可见
-> bucket_lc_post()
如果是空查每次有1写3读,耗时约4ms,每个worker大概的IO流程是:
1,lock_exclusive 写lc.x,获取lock,成功(这个不知道算写还是算读?看代码是WriteOP)
2,cls_rgw_lc_get_head 获取对象的head,成功
3,cls_rgw_lc_get_entry 获取entry,成功,但是为empty
4,unlock (这个算写还是读?)
如果是有任务,但是已在进行中,每次有1写3读,耗时约4ms,每个worker大概的IO流程是:
1,lock_exclusive 写lc.x,获取lock,成功
2,cls_rgw_lc_get_head 获取对象的head,成功
3,cls_rgw_lc_get_entry 获取entry,因为entry的状态是processing
4,unlock
如果lc.x有bucket任务,而且没有人执行过这个,大概4写2读,每个worker大概的IO流程是:
1,lock_exclusive 写lc.x,获取lock,成功
2,cls_rgw_lc_get_head 获取对象的head,成功
3,cls_rgw_lc_get_entry 获取entry,成功
4,cls_rgw_lc_set_entry 设置为processing,成功
5,cls_rgw_lc_put_head 设置marker,成功
6,bucket_lc_process 开始处理bucket
7,unlock