432trino 内存相关配置

reservedBytes 预定的内存;Reservations 预定、预约;Revocable 可废止的,可撤回的;allocations 分配

/ui/api/worker/yj-datanode1-0460/status

返回worker 的 heap 和Processors(既cpu 数)

LocalMemoryManager 管理 MemoryPool,MemoryPool=heap - (memory.heap-headroom-per-node,默认=heap*0.3)

trino_memory_MemoryPool_MaxBytes{subcluster="subcluster",instance=\~"datanode"}

trino_memory_MemoryPool_FreeBytes{subcluster="subcluster",instance=\~"datanode"}

trino_memory_MemoryPool_ReservedBytes{subcluster="subcluster",instance=\~"datanode"}

worker 内存

maxBytes=heap - (memory.heap-headroom-per-node,默认=heap*0.3)

FreeBytes = maxBytes - reservedBytes - reservedRevocableBytes

cluster 内存

ClusterMemoryPool

blockedNodes 可以用于监控某个机器有没有空闲资源 FreeBytes() + ReservedRevocableBytes() <=0

totalDistributedBytes=sum_node(MaxBytes)

reservedDistributedBytes=sum_node(ReservedBytes)

reservedRevocableDistributedBytes=sume_node(ReservedRevocableBytes)

clusterMemorymanager

clusterMemoryBytes=sum_node(MaxBytes)

totalAvailableProcessors=sum_node(AvailableProcessors)

clusterUserMemoryReservation=sum_query(UserMemoryReservation)

clusterTotalMemoryReservation=sum_query(TotalMemoryReservation)

trino 查询模型

node 可以运行多个task, task 处理多个split

query-stage-task-split(driver)

task 配置

task.concurrency 并行运算符(例如连接和聚合)的默认本地并发性,默认值:节点的物理CPU数量,最小值为2,最大值为32

task.max-drivers-per-task 控制task同时运行的最大driver数量,默认值: max_int

task.max-worker-threads 设置task处理分片时使用的线程数。如果工作器 CPU 利用率较低且所有线程都在使用中,则增加此数字可以提高吞吐量,但这会导致堆空间使用量增加,默认值: cpu*2

node 配置

node-scheduler.max-splits-per-node 增加此值可以改善查询延迟 默认值:256

node-scheduler.min-pending-splits-per-task 默认值:16

node-scheduler.max-adjusted-pending-splits-per-task 默认值:2000

相关推荐
Lx35235 分钟前
Hadoop异常处理机制:优雅处理失败任务
大数据·hadoop
小嵌同学1 小时前
Linux:malloc背后的实现细节
大数据·linux·数据库
IT毕设梦工厂2 小时前
大数据毕业设计选题推荐-基于大数据的国家基站整点数据分析系统-Hadoop-Spark-数据可视化-BigData
大数据·hadoop·spark·毕业设计·源码·数据可视化
江瀚视野2 小时前
苹果要在抖音上卖iPhone了?苹果看上了抖音什么?
大数据
微三云-轩2 小时前
区块链系统:解决549 亿元积分商城是否违法的问题
大数据·小程序·重构·区块链·生活
项目題供诗3 小时前
Hadoop(八)
大数据·hadoop·分布式
在未来等你3 小时前
Kafka面试精讲 Day 7:消息序列化与压缩策略
大数据·分布式·面试·kafka·消息队列
在未来等你3 小时前
Kafka面试精讲 Day 10:事务机制与幂等性保证
大数据·分布式·面试·kafka·消息队列
武子康3 小时前
大数据-91 Spark广播变量:高效共享只读数据的最佳实践 RDD+Scala编程
大数据·后端·spark
deepwater_zone4 小时前
大数据(非结构化数据,Spark,MongoDB)
大数据