432trino 内存相关配置

reservedBytes 预定的内存;Reservations 预定、预约;Revocable 可废止的,可撤回的;allocations 分配

/ui/api/worker/yj-datanode1-0460/status

返回worker 的 heap 和Processors(既cpu 数)

LocalMemoryManager 管理 MemoryPool,MemoryPool=heap - (memory.heap-headroom-per-node,默认=heap*0.3)

trino_memory_MemoryPool_MaxBytes{subcluster="subcluster",instance=\~"datanode"}

trino_memory_MemoryPool_FreeBytes{subcluster="subcluster",instance=\~"datanode"}

trino_memory_MemoryPool_ReservedBytes{subcluster="subcluster",instance=\~"datanode"}

worker 内存

maxBytes=heap - (memory.heap-headroom-per-node,默认=heap*0.3)

FreeBytes = maxBytes - reservedBytes - reservedRevocableBytes

cluster 内存

ClusterMemoryPool

blockedNodes 可以用于监控某个机器有没有空闲资源 FreeBytes() + ReservedRevocableBytes() <=0

totalDistributedBytes=sum_node(MaxBytes)

reservedDistributedBytes=sum_node(ReservedBytes)

reservedRevocableDistributedBytes=sume_node(ReservedRevocableBytes)

clusterMemorymanager

clusterMemoryBytes=sum_node(MaxBytes)

totalAvailableProcessors=sum_node(AvailableProcessors)

clusterUserMemoryReservation=sum_query(UserMemoryReservation)

clusterTotalMemoryReservation=sum_query(TotalMemoryReservation)

trino 查询模型

node 可以运行多个task, task 处理多个split

query-stage-task-split(driver)

task 配置

task.concurrency 并行运算符(例如连接和聚合)的默认本地并发性,默认值:节点的物理CPU数量,最小值为2,最大值为32

task.max-drivers-per-task 控制task同时运行的最大driver数量,默认值: max_int

task.max-worker-threads 设置task处理分片时使用的线程数。如果工作器 CPU 利用率较低且所有线程都在使用中,则增加此数字可以提高吞吐量,但这会导致堆空间使用量增加,默认值: cpu*2

node 配置

node-scheduler.max-splits-per-node 增加此值可以改善查询延迟 默认值:256

node-scheduler.min-pending-splits-per-task 默认值:16

node-scheduler.max-adjusted-pending-splits-per-task 默认值:2000

相关推荐
ycsdn1028 分钟前
Caused by: org.apache.flink.api.common.io.ParseException: Row too short:
大数据·flink
DolphinScheduler社区2 小时前
Apache DolphinScheduler + OceanBase,搭建分布式大数据调度平台的实践
大数据
时差9533 小时前
MapReduce 的 Shuffle 过程
大数据·mapreduce
kakwooi4 小时前
Hadoop---MapReduce(3)
大数据·hadoop·mapreduce
数新网络4 小时前
《深入浅出Apache Spark》系列②:Spark SQL原理精髓全解析
大数据·sql·spark
昨天今天明天好多天9 小时前
【数据仓库】
大数据
油头少年_w10 小时前
大数据导论及分布式存储HadoopHDFS入门
大数据·hadoop·hdfs
Elastic 中国社区官方博客11 小时前
释放专利力量:Patently 如何利用向量搜索和 NLP 简化协作
大数据·数据库·人工智能·elasticsearch·搜索引擎·自然语言处理
力姆泰克11 小时前
看电动缸是如何提高农机的自动化水平
大数据·运维·服务器·数据库·人工智能·自动化·1024程序员节
力姆泰克11 小时前
力姆泰克电动缸助力农业机械装备,提高农机的自动化水平
大数据·服务器·数据库·人工智能·1024程序员节