dolphinScheduler(海豚调度器)分布式机群安装

1、安装包准备

下载好安装包 apache-dolphinscheduler-3.0.0-bin.tar.gz,上传至 /opt

2、解压,重命名
复制代码
cd /opt
tar -zxvf apache-dolphinscheduler-3.0.0-bin.tar.gz
mv apache-dolphinscheduler-3.0.0-bin/ dolphin_install
3、在MySQL8中创建dolphinscheduler数据库
复制代码
mysql -uroot -p
​
mysql> CREATE DATABASE dolphinscheduler DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
​
mysql> GRANT ALL ON dolphinscheduler.* TO 'dolphinscheduler'@'%' IDENTIFIED BY 'Pw#123456';
​
mysql> flush privileges;
4、 修改application.yaml配置文件
复制代码
vim /opt/dolphin_install/alert-server/conf/application.yaml
vim /opt/dolphin_install/api-server/conf/application.yaml
vim /opt/dolphin_install/master-server/conf/application.yaml
vim /opt/dolphin_install/worker-server/conf/application.yaml

找到on-profile: mysql

复制代码
      on-profile: mysql
  datasource:
    driver-class-name: com.mysql.cj.jdbc.Driver
    url: jdbc:mysql://{ip}:3306/dolphinscheduler?useUnicode=true&characterEncoding=UTF-8&allowMultiQueries=true
    username: dolphinscheduler
    password: Pw#123456

{ip}为mysql8数据库ip

复制代码
vim /opt/dolphin_install/api-server/conf/application.yaml
vim /opt/dolphin_install/master-server/conf/application.yaml
vim /opt/dolphin_install/worker-server/conf/application.yaml

找到type: zookeeper

复制代码
  type: zookeeper
  zookeeper:
    namespace: dolphinscheduler
    connect-string: bigdata1:2181,bigdata2:2181,bigdata3:2181

bigdata1:2181,bigdata2:2181,bigdata3:2181 为大数据zookeeper集群

5、 修改common.properties配置文件
复制代码
vim /opt/dolphin_install/alert-server/conf/common.properties
vim /opt/dolphin_install/api-server/conf/common.properties
vim /opt/dolphin_install/master-server/conf/common.properties
vim /opt/dolphin_install/worker-server/conf/common.properties

修改以下配置

复制代码
data.basedir.path=/opt/dolphinscheduler
resource.storage.type=HDFS
fs.defaultFS=hdfs://ns:8020
yarn.resourcemanager.ha.rm.ids=bigdata1,bigdata2

ns为HDFS的命名空间

bigdata1和bigdata2为安装了resource manager的主机名

5、 修改运行时的参数
复制代码
vim /opt/dolph_install/bin/env/dolphinscheduler_env.sh

修改以下配置

复制代码
export JAVA_HOME=${JAVA_HOME:-/usr/local/java/jdk1.8.0_231}
export DATABASE=${DATABASE:-mysql}
export SPRING_JACKSON_TIME_ZONE=${SPRING_JACKSON_TIME_ZONE:-GMT+8}
export REGISTRY_ZOOKEEPER_CONNECT_STRING=${REGISTRY_ZOOKEEPER_CONNECT_STRING:-bigdata1:2181,bigdata2:2181,bigdata3:2181}
export HADOOP_HOME=${HADOOP_HOME:-/opt/cloudera/parcels/CDH/lib/hadoop}
export HADOOP_CONF_DIR=${HADOOP_CONF_DIR:-/opt/cloudera/parcels/CDH/lib/hadoop/etc/hadoop}
export HIVE_HOME=${HIVE_HOME:-/opt/cloudera/parcels/CDH/lib/hive}
6、修改一键部署的相关配置文件(具体内容根据自己的实际规划进行修改)
复制代码
vim /opt/dolph_install/bin/env/install_env.sh

修改以下配置

复制代码
ips=${ips:-"bigdata10,bigdata11,bigdata12"}
sshPort=${sshPort:-"10022"}
masters=${masters:-"bigdata10,bigdata11"}
workers=${workers:-"bigdata10:default,bigdata11:default,bigdata12:default"}
alertServer=${alertServer:-"bigdata10"}
apiServers=${apiServers:-"bigdata11"}
installPath=${installPath:-"/opt/dolphinscheduler"}
​
7、将core-site.xml和hdfs-site.xml文件拷贝到api-server/conf目录下
复制代码
cp /opt/cloudera/parcels/CDH/lib/hadoop/etc/hadoop/core-site.xml /opt/dolph_install/api-server/conf
cp /opt/cloudera/parcels/CDH/lib/hadoop/etc/hadoop/hdfs-site.xml /opt/dolph_install/api-server/conf
8、将mysql-connector-java-8.0.17.jar放入api-server/libs目录下
复制代码
cp mysql-connector-java-8.0.17.jar /opt/dolph_install/api-server/libs
9、初始化数据库
复制代码
mysql -uroot -pPw#123456 < /opt/dolph_install/tools/sql/sql/dolphinscheduler_mysql.sql
10、执行安装命令
复制代码
sh /opt/dolph_install/bin/install.sh
FAQ:
1.解决客户端无法访问mysql8问题
复制代码
use mysql;
update user set host='%' where user='root';
FLUSH PRIVILEGES;
相关推荐
LuminescenceJ5 分钟前
GoEdge 开源CDN 架构设计与工作原理分析
分布式·后端·网络协议·网络安全·rpc·开源·信息与通信
组合缺一3 小时前
论 AI Skills 分布式发展的必然性:从单体智能到“云端大脑”的跃迁
java·人工智能·分布式·llm·mcp·skills
shepherd1264 小时前
深度剖析SkyWalking:从内核原理到生产级全链路监控实战
分布式·后端·skywalking
DolphinScheduler社区5 小时前
Linux 环境下,Apache DolphinScheduler 如何驱动 Flink 消费 Kafka 数据?
linux·flink·kafka·开源·apache·海豚调度·大数据工作流调度
DolphinScheduler社区5 小时前
深度探秘 Apache DolphinScheduler 数据库模式
数据库·开源·apache·开源社区·海豚调度·大数据工作流调度
h7ml6 小时前
基于 RabbitMQ 构建异步化淘客订单处理流水线:解耦、削峰与失败重试
分布式·rabbitmq·ruby
夜月蓝汐7 小时前
分布式监控SkyWalking链路追踪
分布式·skywalking
shandongtianhe7 小时前
分布式光伏气象站:实现对光伏电站所处环境的多参数、实时化、高精度监测
分布式
源代码•宸7 小时前
分布式理论基础——Raft算法
经验分享·分布式·后端·算法·golang·集群·raft
J_liaty7 小时前
XXL-Job 实现分布式定时任务
分布式·xxl-job