AirFlow安装和使用

一 从Docker Hub 拉取 Apache Airflow 镜像并上传至本地 Harbor

bash 复制代码
#从 Docker Hub 拉取官方 Apache Airflow 镜像
docker pull apache/airflow:3.1.8-python3.12
#为镜像打标签以匹配 Harbor 仓库格式(假设本地 Harbor 地址为 `harbor.example.com`)
docker tag apache/airflow:3.1.8-python3.12 harbor.example.com/airflow/airflow:3.1.8-python3.12
#登录本地 Harbor 仓库
docker login harbor.example.com
#将打好标签的镜像推送到 Harbor (运行前需要现在本地Harbor仓库新建项目airflow)
docker push harbor.example.com/airflow/airflow:3.1.8-python3.12

二 下载和编辑docker-compose.yaml

bash 复制代码
#从官网下载docker-compose.yaml
curl -LfO 'https://airflow.apache.org/docs/apache-airflow/3.1.8/docker-compose.yaml'

#创建所需目录
mkdir -p ./dags ./logs ./plugins ./config

#改为使用本地docker harbor镜像
image: harbor_ip:harbor_port/airflow/airflow:3.1.8-python3.12

#获取当前的用户 ID,并输出到环境变量
echo -e "AIRFLOW_UID=$(id -u)" > .env

#将 AIRFLOW__CORE__LOAD_EXAMPLES 的值从 'true' 改为 'false'。
#防止 Web UI 中出现大量的示例 DAG,让你专注于自己的业务逻辑。
AIRFLOW__CORE__LOAD_EXAMPLES: 'false'  

#运行命令openssl rand -base64 42 生成一个强随机密钥,配置在.evn文件中
AIRFLOW__API_AUTH__JWT_SECRET=生成的长随机字符串密钥

#生成一个随机的 Fernet Key 并填入
#AIRFLOW__CORE__FERNET_KEY 配置为空字符串,后果非常严重,Airflow 将无法启动,或者启动后无法保存任何敏感信息
python -c "from cryptography.fernet import Fernet; print(Fernet.generate_key().decode())"
AIRFLOW__CORE__FERNET_KEY: 'XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX'

#修改对外暴漏的端口为8086
  airflow-apiserver:
    <<: *airflow-common
    command: api-server
    ports:
      - "8086:8080"


#修改config/airflow.cfg中的配置,开启 Airflow 界面"测试连接"按钮
test_connection = Enabled

三 运行 AirFlow 容器

bash 复制代码
#运行命令进行初始化,最终会返回"airflow-init-1 exited with code 0" 说明初始化成功
docker compose up airflow-init
docker-compose down

#重新启动,这次启动后airflow就能正式工作了
docker compose up -d
#

四 访问 AirFlow Web UI

在浏览器中打开 http://localhost:8086,使用之前创建的管理员用户名和密码登录。

参考资料:

【1】https://airflow.apache.org/docs/apache-airflow/stable/howto/docker-compose/index.html

相关推荐
江华森3 小时前
Spring Cloud 微服务全栈实战:从 Eureka 到 Docker Compose 一文贯通
运维
江华森3 小时前
Matplotlib 数据绘图基础入门
运维
江华森3 小时前
NumPy 数值计算基础入门
运维
乘云数字DATABUFF4 天前
5分钟部署开源APM Databuff:OpenTelemetry全链路追踪入门实战
运维·后端
荣--6 天前
一键部署不是为了省时间 —— 它是把"买来的 PaaS"变成"自己的平台"的拐点
运维·zabbix·工程化·一键部署·平台化·边界设计
江华森6 天前
动手实战学 Docker — 从零到集群编排完全指南
运维
Avan_菜菜7 天前
FRP 内网穿透完整实战:从 HTTP 映射到 HTTPS 自签代理
运维·nginx·https
SelectDB8 天前
Litefuse 开源并推出单进程轻量模式,25 秒就能跑起来的 Agent 可观测与评估平台
运维·后端·自动化运维
XIAOHEZIcode9 天前
Linux系统鼠标偏移常见原因以及修复方案
linux·运维·游戏
用户03284722207010 天前
如何搭建本地yum源(上)
运维