大数据治理域——计算管理本文主要探讨了大数据治理域中的计算管理问题,特别是系统优化和任务优化两个方面。文章首先指出MaxCompute集群任务众多,资源消耗巨大,因此需要优化计算资源以提高性能和任务产出时间。文章介绍了HBO(基于历史的优化器)和CBO(基于代价的优化器)两种优化方式,详细阐述了它们的原理和优势。HBO通过任务历史执行情况和集群状态信息为任务分配合理资源,而CBO则通过收集统计信息计算执行代价,选择最优执行方式。文章还介绍了MaxCompute原资源分配策略以及HBO的提出背景,最后探讨了任务优化中的Map、Jo