HDFS RPC响应调优:FairCallQueue调优

参考材料:

Apache Hadoop 3.4.0 -- Fair Call Queue Guide

一、案例

在 core-site.xml 配置文件中添加如下配置项:

XML 复制代码
<property>
     <name>ipc.8020.callqueue.impl</name>
     <value>org.apache.hadoop.ipc.FairCallQueue</value>
</property>
<property>
     <name>ipc.8020.scheduler.impl</name>
     <value>org.apache.hadoop.ipc.DecayRpcScheduler</value>
</property>
<property>
     <name>ipc.8020.scheduler.priority.levels</name>
     <value>2</value>
</property>
<property>
     <name>ipc.8020.faircallqueue.multiplexer.weights</name>
     <value>32,1</value>
</property>
<property>
     <name>ipc.8020.decay-scheduler.thresholds</name>
     <value>90</value>
</property>
<property>
     <name>ipc.8020.backoff.enable</name>
     <value>true</value>
</property>

配置详解:

callqueue.impl: 默认配置为java.util.concurrent.LinkedBlockingQueue(FIFO queue),可配置项为org.apache.hadoop.ipc.FairCallQueue(公平队列),是按分配优先级权重放置请求到队列中。与FairCallQueue一起使用的RpcScheduler的实现是DecayRpcScheduler,它维护为每个用户接收的请求计数。这个计数随着时间的推移而衰减;每个扫描周期(默认为5s),每个用户的请求数乘以衰减因子(默认为0.5)。这维护了每个用户请求计数的加权/滚动平均值。每次执行扫描时,所有已知用户的调用计数将从高到低排序。根据用户发起呼叫的比例,为每个用户分配优先级(默认0 ~ 3,0为最高优先级)。默认的优先级阈值为(0.125、0.25、0.5),即呼叫占总呼叫数50%以上(最多只能有一个)的用户优先级最低,占总呼叫数25% ~ 50%的用户优先级第二低,占总呼叫数12.5% ~ 25%的用户优先级第二高,其他用户优先级最高。在扫描结束时,每个已知用户都有一个缓存优先级,该优先级将一直使用到下一次扫描;在扫描之间出现的新用户的优先级将被即时计算。

复制代码
scheduler.impl:默认 org.apache.hadoop.ipc.DefaultRpcScheduler (no-op scheduler) 。如果callqueue.impl配置了FairCallQueue,该参数默认为 org.apache.hadoop.ipc.DecayRpcScheduler。
复制代码
scheduler.priority.levels:配置优先级等级,默认4个优先级级别。每个优先级可以配置权重。
复制代码
faircallqueue.multiplexer.weights:为每个优先级队列配置权重,是一个以逗号分隔的列表形式。在FairCallQueue中,有多个优先级队列,每个优先级队列都指定一个权重。当请求到达调用队列时,根据(由RpcScheduler)分配给调用的当前优先级,将请求放入这些优先级队列之一。当处理程序线程试图从调用队列中获取一个项目时,它从哪个队列中提取是通过RpcMultiplexer决定的;目前,这是硬编码为WeightedRoundRobinMultiplexer。WRRM根据队列的权重为请求提供服务;默认4个优先级级别的默认权重为(8,4,2,1)。因此,WRRM将从最高优先级队列提供8个请求,从第二高队列提供4个请求,从第三高队列提供2个请求,从最低队列提供1个请求,然后从最高优先级队列提供8个请求,以此类推。
复制代码
decay-scheduler.thresholds:每个优先级队列的客户端负载阈值,以整数百分比表示。客户机产生的负载(占总操作的百分比)低于位置i所指定的负载,将被赋予优先级i。这应该是一个长度等于优先级级别数减去1的逗号分隔列表(最后一个隐式为100)。

backoff.enable:一种可配置的回退机制,默认false。在这种机制中,服务器将向客户端抛出异常,而不是处理它;在再次尝试之前,客户端需要等待一段时间(例如,通过指数回退)。通常,当队列已满时,试图将请求放入(FCQ的)优先级队列时,会触发回退。这有助于进一步推迟有影响的客户机,减少负载,并且可以带来实质性的好处。还有一个根据响应时间后退的特性,如果高优先级的请求得到的服务太慢,它将导致较低优先级的请求后退。例如,如果将优先级1的响应时间阈值设置为10秒,但该队列中的平均响应时间为12秒,则优先级级别为2或更低的传入请求将接收回退异常,而优先级级别为0和1的请求将正常进行。这样做的目的是,当整体系统负载重到足以导致高优先级客户端受到影响时,迫使较重的客户端退出。

以上参数仅供参考,更多详细参数请见官方文档:Apache Hadoop 3.4.0 -- Fair Call Queue Guide

相关推荐
薛·17 分钟前
记一次因ThreadPoolExecutor多线程导致服务器内存压满问题
java·服务器
胡歌_北京分歌29 分钟前
【CentOS 7 上安装 Oracle JDK 8u333】
java·centos
结衣结衣.30 分钟前
完全理解C语言函数
java·linux·c语言·数据库·经验分享·笔记
对许1 小时前
Java操作Excel最佳实践
java·spark·excel
高级程序源1 小时前
springboot学生档案信息管理系统-计算机毕业设计源码96509
java·spring boot·spring·eclipse·mybatis·idea
小的~~1 小时前
大数据面试题之数据库(2)
大数据·数据库
迅腾文化1 小时前
品牌推广的深层逻辑:自我提升与市场认同的和谐共生
大数据·人工智能·物联网·信息可视化·媒体
martian6651 小时前
学懂C#编程:属性(Property)的概念定义及使用详解
java·开发语言·c#·属性·property
阿亮说技术2 小时前
Java毕业设计 基于SSM vue电影院票务系统小程序 微信小程序
java·微信小程序·毕业设计·课程设计
时间瑾2 小时前
线程池实践篇
java·开发语言