Hadoop复习(九)

Azkaban工作流管理器

选择

问题 1 判断题

2 / 2 分

工作流是指具有依赖的一组job任务,被依赖的job任务最后执行

正确

错误

问题 2 判断题

2 / 2 分

Azkaban兼容任何版本的Hadoop

正确

错误

问题 3 判断题

2 / 2 分

独立服务器模式下,Azkaban的3个核心 组件运行在服务器的同一进程

正确

错误

问题 4 单项选择

2 / 2 分

下列选项中,属于独立服务器模式下Relational DataBase使用的数据库是( )

SQLite

PostgreSQL

H2

Derby

问题 5 判断题

2 / 2 分

Azkaban Web Server会频繁地访问Relational DataBase 以获取数据

正确

错误

简述Azkaban的3个核心组件的作用

  1. 执行服务器(Executor Server) 负责具体任务的执行,接收从调度服务器分配的任务并在本地执行这些任务,同时监控任务的运行状态并反馈执行结果。

  2. 调度服务器(Scheduler Server) 负责根据预设的时间、条件等规则安排任务的执行顺序和时间,管理任务的依赖关系并进行合理调度。

  3. Web 服务器(Web Server) 为用户提供专业的执行专家提供一个基于 Web 的界面,方便用户进行工作流的配置、管理和监控等操作,实现对工作流的全面掌控。

相关推荐
电商数据girl几秒前
Python 爬虫获得淘宝商品详情 数据【淘宝商品API】
大数据·开发语言·人工智能·爬虫·python·json·php
W-GEO19 分钟前
GEO优化策略:AI搜索引擎的“动态响应”与GEO优化公司的实时优化能力
大数据·人工智能·chatgpt
TDengine (老段)1 小时前
TDengine IDMP 应用场景:电动汽车
大数据·数据库·物联网·ai·时序数据库·iot·tdengine
技术与健康8 小时前
LLM实践系列:利用LLM重构数据科学流程03- LLM驱动的数据探索与清洗
大数据·人工智能·重构
TDengine (老段)8 小时前
TDengine IDMP 应用场景:工业锅炉监控
大数据·数据库·物联网·信息可视化·时序数据库·tdengine
软件开发明哥10 小时前
BigData大数据应用开发学习笔记(06)实时检索--HBase
大数据
杨荧10 小时前
基于Python的农作物病虫害防治网站 Python+Django+Vue.js
大数据·前端·vue.js·爬虫·python
AKAMAI12 小时前
在分布式计算区域中通过VPC搭建私有网络
人工智能·分布式·云计算
卖寂寞的小男孩13 小时前
spark数据缓存机制
大数据·缓存·spark
jiedaodezhuti13 小时前
Flink直接缓冲存储器异常解析与解决方案
大数据·flink