Hadoop----Azkaban的使用与一些报错问题的解决

1.因为官方只放出源码,并没有放出其tar包,所以需要我们自己编译,通过查阅资料我们可以使用gradlew对其进行编译,还是比较简单,然后将里面需要用到的服务文件夹进行拷贝,完善其文件夹结构,通常会缺少几个,需要自己创建一个,然后再从其他目录中复制几个到目标服务。再配置各个服务的xml文件即可。

2.需要用到MySQL,需要创建azkaban数据库,在构建好的项目中,有一个sql脚本(带start字眼),在mysql中执行source命令即可导入。

3.启动Executor,在启动Web服务,在浏览默器中输入

https://node1:8443

node1为自己的启动机器,8443也是可以在xml中指定的,如果用配置ssl的key,可以使用https进行访问,弹出警告只需要点击已经了解风险即可访问网页:

4.在启动web服务时,会报错!

  1. Error injecting constructor, azkaban.executor.ExecutorManagerException: No active executor found

问题时已经启动了,executor为何会说不活跃?

需要多加一步,打开MySQL:

mysql -u root -p

输入密码进入mysql客户端,输入以下sql:

update azkaban.executors set active=1;

将数据库表中的active的值改为1则为active状态。

注意:在启动服务中,都会在对应的目录下生成日志文件,要去打开查看,才会知道有没有报错,如出现Java的异常报错如xxxException那就要去根据问题去找问题,去百度。

相关推荐
宇宙机长8 分钟前
【kafka】消息队列
分布式·kafka
数据皮皮侠19 分钟前
中国汽车能源消耗量(2010-2024年)
大数据·数据库·人工智能·物联网·金融·汽车·能源
TDengine (老段)30 分钟前
TDengine 转化函数 TO_TIMESTAMP 用户手册
java·大数据·数据库·物联网·时序数据库·tdengine·涛思数据
java叶新东老师1 小时前
七、搭建springCloudAlibaba2021.1版本分布式微服务-skywalking9.0链路追踪
分布式·微服务·架构
LiRuiJie1 小时前
基于Hadoop3.3.4+Flink1.17.0+FlinkCDC3.0.0+Iceberg1.5.0整合,实现数仓实时同步mysql数据
大数据·hadoop·flink·iceberg·flinkcdc
cici158741 小时前
Docker搭建Hadoop集群
hadoop·docker·eureka
时序数据说2 小时前
时序数据库IoTDB的优势场景分析
大数据·数据库·物联网·时序数据库·iotdb
橘子在努力2 小时前
【橘子分布式】gRPC(番外篇-客户端重试机制)
java·分布式·rpc
Leo.yuan2 小时前
数据处理工具是做什么的?常见数据处理方法介绍
大数据·数据库·人工智能·python·信息可视化
Leckun2 小时前
Kafka 3.9.1的KRaft模式部署
分布式·kafka