Ceph 中与“重构/恢复/回填/重平衡”相关的参数表

文章目录

      • [Ceph 参数调优(重构相关)](#Ceph 参数调优(重构相关))
      • 备注

Ceph 中与"重构/恢复/回填/重平衡"相关的参数表
我只用了 Ceph 官方文档 可明确核实到的内容; 拿不准或官方没有统一建议值的地方我留空 。另外要注意, 不同版本(Pacific / Quincy / Reef / 最新版)默认值可能有差异 ,下面优先采用当前官方文档可查到的默认值。( Ceph 文档)

Ceph 参数调优(重构相关)

参数说明 执行修改组件 参数说明 参数含义 默认值 建议值 修改说明
恢复 / 回填 osd osd_max_backfills 单个 OSD 允许并发进行的 backfill 数量(入向/出向分别生效) 1 调大可加快回填,但会明显增加对业务 IO 的影响;官方说明该值在启用 mClock 调度器时会被自动重置。(Ceph 文档)
恢复 / 回填 osd osd_recovery_max_active 单个 OSD 同时处理的 active recovery 请求数 0 该值为 0 时,实际使用介质类型对应的 osd_recovery_max_active_hddosd_recovery_max_active_ssd;启用 mClock 时会被自动重置。(Ceph 文档)
恢复 / 回填 osd osd_recovery_max_active_hdd HDD OSD 的并发 recovery 请求数 3 适用于机械盘;调大可缩短恢复时间,但会抬高业务时延;启用 mClock 时会被自动重置。(Ceph 文档)
恢复 / 回填 osd osd_recovery_max_active_ssd SSD OSD 的并发 recovery 请求数 10 适用于 SSD/NVMe;官方明确该值在 mClock 启用时会被自动重置。(Ceph 文档)
恢复 / 回填 osd osd_recovery_sleep 每次 recovery/backfill 操作之间的休眠时间(秒) 0.0 调大后恢复更慢,但对前台业务影响更小;官方说明启用 mClock 时该参数被忽略。(Ceph 文档)
恢复 / 回填 osd osd_recovery_sleep_hdd HDD 场景下 recovery/backfill 的休眠时间(秒) 0.1 主要用于机械盘限速;启用 mClock 时该参数被忽略。(Ceph 文档)
恢复 / 回填 osd osd_recovery_sleep_ssd SSD 场景下 recovery/backfill 的休眠时间(秒) 0.0 SSD 默认不额外 sleep;启用 mClock 时该参数被忽略。(Ceph 文档)
恢复 / 回填 osd osd_recovery_sleep_hybrid 数据在 HDD、WAL/DB 在 SSD 的混合场景 recovery/backfill 休眠时间(秒) 0.025 混合盘场景限速参数;启用 mClock 时该参数被忽略。(Ceph 文档)
恢复 / 回填 osd osd_recovery_op_priority recovery 操作优先级 3 值越高越偏向恢复,值越低越偏向客户端 IO。若池级别设置了 recovery_op_priority,则可覆盖默认行为。(Ceph 文档)
业务 / 恢复优先级 osd osd_client_op_priority 客户端操作优先级 63 官方默认"显著偏向客户端 IO";通常与 osd_recovery_op_priority 一起看。(Ceph 文档)
恢复期负载控制 osd osd_scrub_during_recovery 是否允许在恢复期间启动新的 scrub / deep-scrub false 设为 false 时,恢复期间不再调度新的 scrub,可降低集群忙时负载;已开始的 scrub 会继续执行。(Ceph 文档)
自动重平衡 mgr balancer mode 自动平衡模式 upmap 当前官方文档说明默认模式为 upmap;新集群默认启用 balancer 模块。旧客户端兼容性不足时不能直接使用 upmap。(Ceph 文档)
自动重平衡 mgr target_max_misplaced_ratio 单轮自动平衡允许迁移的 PG 最大比例 5% 官方文档明确默认值为 5%,示例中演示可改为 3%,但未给出统一推荐值。该值越大,平衡收敛越快,但对业务影响可能更大。(Ceph 文档)
自动重平衡 mgr mgr/balancer/upmap_max_deviation 认为"已经足够平衡"时允许的 PG 偏差 5 1 官方文档说明默认值为 5;对于多设备类型OSD 容量差异较大 的集群,1 是"reasonable and safe for most clusters"的值。(Ceph 文档)
自动重平衡 mgr mgr/balancer/sleep_interval balancer 两轮运行之间的休眠秒数 官方文档给出了配置方式,但在该页未明确写出默认值,因此留空。(Ceph 文档)
mClock 相关 osd osd_mclock_override_recovery_settings 是否允许用传统 recovery/backfill 参数覆盖 mClock 的限制 false 官方说明启用后,可让 osd_recovery_max_active_hddosd_recovery_max_active_ssdosd_max_backfills 等参数对 mClock 生效。(Ceph 文档)

备注

  1. 你图里的表是"参数说明 / 执行修改组件 / 参数名 / 参数说明 / 默认值 / 建议值 / 修改说明"这种结构,我这里按同样逻辑做了文字版。
  2. 严格来说,Ceph 里"重构"一般会落到几类动作:recovery(恢复)backfill(回填)rebalance / balancer(重平衡) 。上表把这三类最常用、最能影响恢复速度与业务影响面的参数放在一起了。相关行为和 balancer 默认模式、upmap 兼容性,官方文档都有明确说明。(Ceph 文档)
  3. 很关键的一点:如果集群启用了 mClock 调度器 ,不少传统恢复参数会被自动重置或忽略 ,例如 osd_max_backfillsosd_recovery_max_active_*osd_recovery_sleep* 等,所以实际调参前要先确认调度器模式。(Ceph 文档)

你要的话,我可以下一步直接把这份内容整理成一版 更像你截图那种可直接粘进 Word/Excel 的表格格式

相关推荐
寻见9031 小时前
Java为什么能“一次编写,到处运行”?JVM到底解决了什么核心痛点?
java·jvm·java ee
xjdkxnhcoskxbco1 小时前
Java 多线程“八锁”问题深度解析
java·开发语言·多线程
AI克斯1 小时前
【通俗易懂】注解(@)的理解
java
spencer_tseng2 小时前
‘<>‘ operator is not allowed for source level below 1.7
java
张驰咨询sigma2 小时前
无人机可靠性困局的工程解:以六西格玛体系重构“设计-制造”一致性
重构·无人机·制造·六西格玛培训·六西格玛咨询·六西格玛绿带培训·六西格玛培训公司
人道领域2 小时前
Day | 07 【苍穹外卖:菜品套餐的缓存】
java·开发语言·redis·缓存击穿·springcache
m0_706653232 小时前
数据库与缓存操作策略:数据一致性与并发问题
java·数据库·缓存
独断万古他化2 小时前
【抽奖系统开发实战】Spring Boot 活动模块设计:事务保障、缓存优化与列表展示
java·spring boot·redis·后端·缓存·mvc
BioRunYiXue2 小时前
甘油不够了,能用植物油保存菌种吗?
java·linux·运维·服务器·网络·人工智能·eclipse