432trino 内存相关配置

红烛暗盗梦2024-03-21 22:45

reservedBytes 预定的内存；Reservations 预定、预约；Revocable 可废止的，可撤回的；allocations 分配

/ui/api/worker/yj-datanode1-0460/status

返回worker 的 heap 和Processors（既cpu 数）

LocalMemoryManager 管理 MemoryPool，MemoryPool=heap - (memory.heap-headroom-per-node,默认=heap*0.3)

trino_memory_MemoryPool_MaxBytes{subcluster=" $subcluster",instance=\~"$ datanode"}

trino_memory_MemoryPool_FreeBytes{subcluster=" $subcluster",instance=\~"$ datanode"}

trino_memory_MemoryPool_ReservedBytes{subcluster=" $subcluster",instance=\~"$ datanode"}

maxBytes=heap - (memory.heap-headroom-per-node,默认=heap*0.3)

FreeBytes = maxBytes - reservedBytes - reservedRevocableBytes

ClusterMemoryPool

blockedNodes 可以用于监控某个机器有没有空闲资源 FreeBytes() + ReservedRevocableBytes() <=0

totalDistributedBytes=sum_node(MaxBytes)

reservedDistributedBytes=sum_node(ReservedBytes)

reservedRevocableDistributedBytes=sume_node(ReservedRevocableBytes)

clusterMemorymanager

clusterMemoryBytes=sum_node(MaxBytes)

totalAvailableProcessors=sum_node(AvailableProcessors)

clusterUserMemoryReservation=sum_query(UserMemoryReservation)

clusterTotalMemoryReservation=sum_query(TotalMemoryReservation)

node 可以运行多个task, task 处理多个split

query-stage-task-split(driver)

task.max-drivers-per-task 控制task同时运行的最大driver数量,默认值： max_int

task.max-worker-threads 设置task处理分片时使用的线程数。如果工作器 CPU 利用率较低且所有线程都在使用中，则增加此数字可以提高吞吐量，但这会导致堆空间使用量增加，默认值： cpu*2

node-scheduler.max-splits-per-node 增加此值可以改善查询延迟默认值：256

node-scheduler.min-pending-splits-per-task 默认值：16

node-scheduler.max-adjusted-pending-splits-per-task 默认值：2000