Ceph 中与“重构/恢复/回填/重平衡”相关的参数表

文章目录

      • [Ceph 参数调优(重构相关)](#Ceph 参数调优(重构相关))
      • 备注

Ceph 中与"重构/恢复/回填/重平衡"相关的参数表
我只用了 Ceph 官方文档 可明确核实到的内容; 拿不准或官方没有统一建议值的地方我留空 。另外要注意, 不同版本(Pacific / Quincy / Reef / 最新版)默认值可能有差异 ,下面优先采用当前官方文档可查到的默认值。( Ceph 文档)

Ceph 参数调优(重构相关)

参数说明 执行修改组件 参数说明 参数含义 默认值 建议值 修改说明
恢复 / 回填 osd osd_max_backfills 单个 OSD 允许并发进行的 backfill 数量(入向/出向分别生效) 1 调大可加快回填,但会明显增加对业务 IO 的影响;官方说明该值在启用 mClock 调度器时会被自动重置。(Ceph 文档)
恢复 / 回填 osd osd_recovery_max_active 单个 OSD 同时处理的 active recovery 请求数 0 该值为 0 时,实际使用介质类型对应的 osd_recovery_max_active_hddosd_recovery_max_active_ssd;启用 mClock 时会被自动重置。(Ceph 文档)
恢复 / 回填 osd osd_recovery_max_active_hdd HDD OSD 的并发 recovery 请求数 3 适用于机械盘;调大可缩短恢复时间,但会抬高业务时延;启用 mClock 时会被自动重置。(Ceph 文档)
恢复 / 回填 osd osd_recovery_max_active_ssd SSD OSD 的并发 recovery 请求数 10 适用于 SSD/NVMe;官方明确该值在 mClock 启用时会被自动重置。(Ceph 文档)
恢复 / 回填 osd osd_recovery_sleep 每次 recovery/backfill 操作之间的休眠时间(秒) 0.0 调大后恢复更慢,但对前台业务影响更小;官方说明启用 mClock 时该参数被忽略。(Ceph 文档)
恢复 / 回填 osd osd_recovery_sleep_hdd HDD 场景下 recovery/backfill 的休眠时间(秒) 0.1 主要用于机械盘限速;启用 mClock 时该参数被忽略。(Ceph 文档)
恢复 / 回填 osd osd_recovery_sleep_ssd SSD 场景下 recovery/backfill 的休眠时间(秒) 0.0 SSD 默认不额外 sleep;启用 mClock 时该参数被忽略。(Ceph 文档)
恢复 / 回填 osd osd_recovery_sleep_hybrid 数据在 HDD、WAL/DB 在 SSD 的混合场景 recovery/backfill 休眠时间(秒) 0.025 混合盘场景限速参数;启用 mClock 时该参数被忽略。(Ceph 文档)
恢复 / 回填 osd osd_recovery_op_priority recovery 操作优先级 3 值越高越偏向恢复,值越低越偏向客户端 IO。若池级别设置了 recovery_op_priority,则可覆盖默认行为。(Ceph 文档)
业务 / 恢复优先级 osd osd_client_op_priority 客户端操作优先级 63 官方默认"显著偏向客户端 IO";通常与 osd_recovery_op_priority 一起看。(Ceph 文档)
恢复期负载控制 osd osd_scrub_during_recovery 是否允许在恢复期间启动新的 scrub / deep-scrub false 设为 false 时,恢复期间不再调度新的 scrub,可降低集群忙时负载;已开始的 scrub 会继续执行。(Ceph 文档)
自动重平衡 mgr balancer mode 自动平衡模式 upmap 当前官方文档说明默认模式为 upmap;新集群默认启用 balancer 模块。旧客户端兼容性不足时不能直接使用 upmap。(Ceph 文档)
自动重平衡 mgr target_max_misplaced_ratio 单轮自动平衡允许迁移的 PG 最大比例 5% 官方文档明确默认值为 5%,示例中演示可改为 3%,但未给出统一推荐值。该值越大,平衡收敛越快,但对业务影响可能更大。(Ceph 文档)
自动重平衡 mgr mgr/balancer/upmap_max_deviation 认为"已经足够平衡"时允许的 PG 偏差 5 1 官方文档说明默认值为 5;对于多设备类型OSD 容量差异较大 的集群,1 是"reasonable and safe for most clusters"的值。(Ceph 文档)
自动重平衡 mgr mgr/balancer/sleep_interval balancer 两轮运行之间的休眠秒数 官方文档给出了配置方式,但在该页未明确写出默认值,因此留空。(Ceph 文档)
mClock 相关 osd osd_mclock_override_recovery_settings 是否允许用传统 recovery/backfill 参数覆盖 mClock 的限制 false 官方说明启用后,可让 osd_recovery_max_active_hddosd_recovery_max_active_ssdosd_max_backfills 等参数对 mClock 生效。(Ceph 文档)

备注

  1. 你图里的表是"参数说明 / 执行修改组件 / 参数名 / 参数说明 / 默认值 / 建议值 / 修改说明"这种结构,我这里按同样逻辑做了文字版。
  2. 严格来说,Ceph 里"重构"一般会落到几类动作:recovery(恢复)backfill(回填)rebalance / balancer(重平衡) 。上表把这三类最常用、最能影响恢复速度与业务影响面的参数放在一起了。相关行为和 balancer 默认模式、upmap 兼容性,官方文档都有明确说明。(Ceph 文档)
  3. 很关键的一点:如果集群启用了 mClock 调度器 ,不少传统恢复参数会被自动重置或忽略 ,例如 osd_max_backfillsosd_recovery_max_active_*osd_recovery_sleep* 等,所以实际调参前要先确认调度器模式。(Ceph 文档)

你要的话,我可以下一步直接把这份内容整理成一版 更像你截图那种可直接粘进 Word/Excel 的表格格式

相关推荐
pshdhx_albert4 小时前
AI agent实现打字机效果
java·http·ai编程
沉鱼.444 小时前
第十二届题目
java·前端·算法
赫瑞5 小时前
数据结构中的排列组合 —— Java实现
java·开发语言·数据结构
周末也要写八哥6 小时前
多进程和多线程的特点和区别
java·开发语言·jvm
惜茶7 小时前
vue+SpringBoot(前后端交互)
java·vue.js·spring boot
杰克尼7 小时前
springCloud_day07(MQ高级)
java·spring·spring cloud
NHuan^_^9 小时前
SpringBoot3 整合 SpringAI 实现ai助手(记忆)
java·人工智能·spring boot
Mr_Xuhhh9 小时前
从ArrayList到LinkedList:理解链表,掌握Java集合的另一种选择
java·数据结构·链表
错把套路当深情9 小时前
Java 全方向开发技术栈指南
java·开发语言
han_hanker10 小时前
springboot 一个请求的顺序解释
java·spring boot·后端