AirFlow安装和使用

一 从Docker Hub 拉取 Apache Airflow 镜像并上传至本地 Harbor

bash 复制代码
#从 Docker Hub 拉取官方 Apache Airflow 镜像
docker pull apache/airflow:3.1.8-python3.12
#为镜像打标签以匹配 Harbor 仓库格式(假设本地 Harbor 地址为 `harbor.example.com`)
docker tag apache/airflow:3.1.8-python3.12 harbor.example.com/airflow/airflow:3.1.8-python3.12
#登录本地 Harbor 仓库
docker login harbor.example.com
#将打好标签的镜像推送到 Harbor (运行前需要现在本地Harbor仓库新建项目airflow)
docker push harbor.example.com/airflow/airflow:3.1.8-python3.12

二 下载和编辑docker-compose.yaml

bash 复制代码
#从官网下载docker-compose.yaml
curl -LfO 'https://airflow.apache.org/docs/apache-airflow/3.1.8/docker-compose.yaml'

#创建所需目录
mkdir -p ./dags ./logs ./plugins ./config

#改为使用本地docker harbor镜像
image: harbor_ip:harbor_port/airflow/airflow:3.1.8-python3.12

#获取当前的用户 ID,并输出到环境变量
echo -e "AIRFLOW_UID=$(id -u)" > .env

#将 AIRFLOW__CORE__LOAD_EXAMPLES 的值从 'true' 改为 'false'。
#防止 Web UI 中出现大量的示例 DAG,让你专注于自己的业务逻辑。
AIRFLOW__CORE__LOAD_EXAMPLES: 'false'  

#运行命令openssl rand -base64 42 生成一个强随机密钥,配置在.evn文件中
AIRFLOW__API_AUTH__JWT_SECRET=生成的长随机字符串密钥

#生成一个随机的 Fernet Key 并填入
#AIRFLOW__CORE__FERNET_KEY 配置为空字符串,后果非常严重,Airflow 将无法启动,或者启动后无法保存任何敏感信息
python -c "from cryptography.fernet import Fernet; print(Fernet.generate_key().decode())"
AIRFLOW__CORE__FERNET_KEY: 'XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX'

#修改对外暴漏的端口为8086
  airflow-apiserver:
    <<: *airflow-common
    command: api-server
    ports:
      - "8086:8080"


#修改config/airflow.cfg中的配置,开启 Airflow 界面"测试连接"按钮
test_connection = Enabled

三 运行 AirFlow 容器

bash 复制代码
#运行命令进行初始化,最终会返回"airflow-init-1 exited with code 0" 说明初始化成功
docker compose up airflow-init
docker-compose down

#重新启动,这次启动后airflow就能正式工作了
docker compose up -d
#

四 访问 AirFlow Web UI

在浏览器中打开 http://localhost:8086,使用之前创建的管理员用户名和密码登录。

参考资料:

【1】https://airflow.apache.org/docs/apache-airflow/stable/howto/docker-compose/index.html

相关推荐
liulilittle17 小时前
用户态 TCP 端口转发:对 CUBIC 友好,对 BBR/KCC 收益不大
运维·网络·tcp/ip·计算机网络·信息与通信·tcp·通信
杨了个杨898217 小时前
HAproxy+Keepalive的简介及安装
运维·服务器
utf8mb4安全女神17 小时前
【shell函数】【shell脚本】定期自动检查服务器磁盘使用情况并发出告警
运维·服务器
ShineWinsu17 小时前
对于Linux:进程信号的解析—下
linux·运维·服务器·面试·笔试·进程·信号
Cx330❀18 小时前
【Linux网络】高性能 TCP 服务器:从多线程到线程池的架构演进与落地实践
linux·运维·服务器·网络·c++·tcp/ip·架构
闲猫18 小时前
从0到1完整开发Smartshell最后沉淀出的Cursor开发规则
linux·运维·堡垒机·cursor·vibecoding
AOwhisky18 小时前
MySQL 学习笔记(第七期):高可用架构进阶与综合项目实战
linux·运维·笔记·学习·mysql·高可用·mha
张小姐的猫18 小时前
【Linux】多线程 —— 线程池 | 单例模式 | 常见锁
linux·运维·服务器·c++·单例模式·设计模式·策略模式
无限进步_18 小时前
【Linux】进程状态、僵尸与孤儿、进程调度
linux·运维·服务器·开发语言·数据结构·算法
Urbano18 小时前
工业及物流工装制作流程与各工序自动化替代方案
运维·自动化