AirFlow安装和使用

一 从Docker Hub 拉取 Apache Airflow 镜像并上传至本地 Harbor

bash 复制代码
#从 Docker Hub 拉取官方 Apache Airflow 镜像
docker pull apache/airflow:3.1.8-python3.12
#为镜像打标签以匹配 Harbor 仓库格式(假设本地 Harbor 地址为 `harbor.example.com`)
docker tag apache/airflow:3.1.8-python3.12 harbor.example.com/airflow/airflow:3.1.8-python3.12
#登录本地 Harbor 仓库
docker login harbor.example.com
#将打好标签的镜像推送到 Harbor (运行前需要现在本地Harbor仓库新建项目airflow)
docker push harbor.example.com/airflow/airflow:3.1.8-python3.12

二 下载和编辑docker-compose.yaml

bash 复制代码
#从官网下载docker-compose.yaml
curl -LfO 'https://airflow.apache.org/docs/apache-airflow/3.1.8/docker-compose.yaml'

#创建所需目录
mkdir -p ./dags ./logs ./plugins ./config

#改为使用本地docker harbor镜像
image: harbor_ip:harbor_port/airflow/airflow:3.1.8-python3.12

#获取当前的用户 ID,并输出到环境变量
echo -e "AIRFLOW_UID=$(id -u)" > .env

#将 AIRFLOW__CORE__LOAD_EXAMPLES 的值从 'true' 改为 'false'。
#防止 Web UI 中出现大量的示例 DAG,让你专注于自己的业务逻辑。
AIRFLOW__CORE__LOAD_EXAMPLES: 'false'  

#运行命令openssl rand -base64 42 生成一个强随机密钥,配置在.evn文件中
AIRFLOW__API_AUTH__JWT_SECRET=生成的长随机字符串密钥

#生成一个随机的 Fernet Key 并填入
#AIRFLOW__CORE__FERNET_KEY 配置为空字符串,后果非常严重,Airflow 将无法启动,或者启动后无法保存任何敏感信息
python -c "from cryptography.fernet import Fernet; print(Fernet.generate_key().decode())"
AIRFLOW__CORE__FERNET_KEY: 'XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX'

#修改对外暴漏的端口为8086
  airflow-apiserver:
    <<: *airflow-common
    command: api-server
    ports:
      - "8086:8080"


#修改config/airflow.cfg中的配置,开启 Airflow 界面"测试连接"按钮
test_connection = Enabled

三 运行 AirFlow 容器

bash 复制代码
#运行命令进行初始化,最终会返回"airflow-init-1 exited with code 0" 说明初始化成功
docker compose up airflow-init
docker-compose down

#重新启动,这次启动后airflow就能正式工作了
docker compose up -d
#

四 访问 AirFlow Web UI

在浏览器中打开 http://localhost:8086,使用之前创建的管理员用户名和密码登录。

参考资料:

【1】https://airflow.apache.org/docs/apache-airflow/stable/howto/docker-compose/index.html

相关推荐
xcbrand17 小时前
餐饮品牌全案公司哪家可靠
运维·python
apl35917 小时前
GUI 型 DevOps 平台的天花板,Ashby 在 1956 年就画好了
运维·devops
云动课堂17 小时前
【运维实战】MySQL 8.0 数据库 · 一键自动化部署方案 (适配银河麒麟 V10 / 龙蜥 8 / Rocky Linux 8 / CentOS 8)
linux·运维·数据库
cui_ruicheng17 小时前
Linux进程间通信(一):管道与IPC基础
linux·运维·服务器
一叶龙洲17 小时前
Ubuntu开机无法用向日葵远程控制
linux·运维·ubuntu
计算机安禾18 小时前
【Linux从入门到镜头】第29篇:文本处理三剑客(下)——awk 数据处理神器
linux·运维·服务器
网络安全许木18 小时前
自学渗透测试第28天(协议补漏与FTP抓包)
运维·服务器·网络安全·渗透测试·php
V我五十买鸡腿18 小时前
网安基础 Windows 和 Linux 那些常用命令
linux·运维·windows
日取其半万世不竭18 小时前
用云服务器部署 Hexo 博客,Nginx 托管静态页面全流程
运维·服务器·nginx
handler0118 小时前
进程状态流转的本质:Linux 内核队列与底层数据结构解密
linux·运维·c语言·数据结构·c++·笔记·学习