432trino 内存相关配置

reservedBytes 预定的内存;Reservations 预定、预约;Revocable 可废止的,可撤回的;allocations 分配

/ui/api/worker/yj-datanode1-0460/status

返回worker 的 heap 和Processors(既cpu 数)

LocalMemoryManager 管理 MemoryPool,MemoryPool=heap - (memory.heap-headroom-per-node,默认=heap*0.3)

trino_memory_MemoryPool_MaxBytes{subcluster="subcluster",instance=\~"datanode"}

trino_memory_MemoryPool_FreeBytes{subcluster="subcluster",instance=\~"datanode"}

trino_memory_MemoryPool_ReservedBytes{subcluster="subcluster",instance=\~"datanode"}

worker 内存

maxBytes=heap - (memory.heap-headroom-per-node,默认=heap*0.3)

FreeBytes = maxBytes - reservedBytes - reservedRevocableBytes

cluster 内存

ClusterMemoryPool

blockedNodes 可以用于监控某个机器有没有空闲资源 FreeBytes() + ReservedRevocableBytes() <=0

totalDistributedBytes=sum_node(MaxBytes)

reservedDistributedBytes=sum_node(ReservedBytes)

reservedRevocableDistributedBytes=sume_node(ReservedRevocableBytes)

clusterMemorymanager

clusterMemoryBytes=sum_node(MaxBytes)

totalAvailableProcessors=sum_node(AvailableProcessors)

clusterUserMemoryReservation=sum_query(UserMemoryReservation)

clusterTotalMemoryReservation=sum_query(TotalMemoryReservation)

trino 查询模型

node 可以运行多个task, task 处理多个split

query-stage-task-split(driver)

task 配置

task.concurrency 并行运算符(例如连接和聚合)的默认本地并发性,默认值:节点的物理CPU数量,最小值为2,最大值为32

task.max-drivers-per-task 控制task同时运行的最大driver数量,默认值: max_int

task.max-worker-threads 设置task处理分片时使用的线程数。如果工作器 CPU 利用率较低且所有线程都在使用中,则增加此数字可以提高吞吐量,但这会导致堆空间使用量增加,默认值: cpu*2

node 配置

node-scheduler.max-splits-per-node 增加此值可以改善查询延迟 默认值:256

node-scheduler.min-pending-splits-per-task 默认值:16

node-scheduler.max-adjusted-pending-splits-per-task 默认值:2000

相关推荐
Data跳动24 分钟前
Spark内存都消耗在哪里了?
大数据·分布式·spark
woshiabc1111 小时前
windows安装Elasticsearch及增删改查操作
大数据·elasticsearch·搜索引擎
lucky_syq2 小时前
Saprk和Flink的区别
大数据·flink
lucky_syq2 小时前
流式处理,为什么Flink比Spark Streaming好?
大数据·flink·spark
袋鼠云数栈2 小时前
深入浅出Flink CEP丨如何通过Flink SQL作业动态更新Flink CEP作业
大数据
小白学大数据3 小时前
如何使用Selenium处理JavaScript动态加载的内容?
大数据·javascript·爬虫·selenium·测试工具
15年网络推广青哥3 小时前
国际抖音TikTok矩阵运营的关键要素有哪些?
大数据·人工智能·矩阵
节点。csn4 小时前
Hadoop yarn安装
大数据·hadoop·分布式
arnold664 小时前
探索 ElasticSearch:性能优化之道
大数据·elasticsearch·性能优化
NiNg_1_2345 小时前
基于Hadoop的数据清洗
大数据·hadoop·分布式