Hadoop复习(九)

Azkaban工作流管理器

选择

问题 1 判断题

2 / 2 分

工作流是指具有依赖的一组job任务,被依赖的job任务最后执行

正确

错误

问题 2 判断题

2 / 2 分

Azkaban兼容任何版本的Hadoop

正确

错误

问题 3 判断题

2 / 2 分

独立服务器模式下,Azkaban的3个核心 组件运行在服务器的同一进程

正确

错误

问题 4 单项选择

2 / 2 分

下列选项中,属于独立服务器模式下Relational DataBase使用的数据库是( )

SQLite

PostgreSQL

H2

Derby

问题 5 判断题

2 / 2 分

Azkaban Web Server会频繁地访问Relational DataBase 以获取数据

正确

错误

简述Azkaban的3个核心组件的作用

  1. 执行服务器(Executor Server) 负责具体任务的执行,接收从调度服务器分配的任务并在本地执行这些任务,同时监控任务的运行状态并反馈执行结果。

  2. 调度服务器(Scheduler Server) 负责根据预设的时间、条件等规则安排任务的执行顺序和时间,管理任务的依赖关系并进行合理调度。

  3. Web 服务器(Web Server) 为用户提供专业的执行专家提供一个基于 Web 的界面,方便用户进行工作流的配置、管理和监控等操作,实现对工作流的全面掌控。

相关推荐
Jay Kay15 分钟前
TensorFlow内核剖析:分布式TensorFlow架构解析与实战指南
分布式·架构·tensorflow
亿牛云爬虫专家2 小时前
Kubernetes下的分布式采集系统设计与实战:趋势监测失效引发的架构进化
分布式·python·架构·kubernetes·爬虫代理·监测·采集
莫彩4 小时前
Mapreduce 工业界批式计算经验汇总(下)
大数据·mapreduce
群联云防护小杜8 小时前
构建分布式高防架构实现业务零中断
前端·网络·分布式·tcp/ip·安全·游戏·架构
爱吃面的猫8 小时前
大数据Hadoop之——Flink1.17.0安装与使用(非常详细)
大数据·hadoop·分布式
Fireworkitte8 小时前
安装 Elasticsearch IK 分词器
大数据·elasticsearch
ywyy679810 小时前
短剧系统开发定制全流程解析:从需求分析到上线的专业指南
大数据·需求分析·短剧·推客系统·推客小程序·短剧系统开发·海外短剧系统开发
上上迁10 小时前
分布式生成 ID 策略的演进和最佳实践,含springBoot 实现(Java版本)
java·spring boot·分布式
长路 ㅤ   10 小时前
Java后端技术博客汇总文档
分布式·算法·技术分享·编程学习·java后端
暗影八度11 小时前
Spark流水线数据质量检查组件
大数据·分布式·spark