一 从Docker Hub 拉取 Apache Airflow 镜像并上传至本地 Harbor
bash
#从 Docker Hub 拉取官方 Apache Airflow 镜像
docker pull apache/airflow:3.1.8-python3.12
#为镜像打标签以匹配 Harbor 仓库格式(假设本地 Harbor 地址为 `harbor.example.com`)
docker tag apache/airflow:3.1.8-python3.12 harbor.example.com/airflow/airflow:3.1.8-python3.12
#登录本地 Harbor 仓库
docker login harbor.example.com
#将打好标签的镜像推送到 Harbor (运行前需要现在本地Harbor仓库新建项目airflow)
docker push harbor.example.com/airflow/airflow:3.1.8-python3.12
二 下载和编辑docker-compose.yaml
bash
#从官网下载docker-compose.yaml
curl -LfO 'https://airflow.apache.org/docs/apache-airflow/3.1.8/docker-compose.yaml'
#创建所需目录
mkdir -p ./dags ./logs ./plugins ./config
#改为使用本地docker harbor镜像
image: harbor_ip:harbor_port/airflow/airflow:3.1.8-python3.12
#获取当前的用户 ID,并输出到环境变量
echo -e "AIRFLOW_UID=$(id -u)" > .env
#将 AIRFLOW__CORE__LOAD_EXAMPLES 的值从 'true' 改为 'false'。
#防止 Web UI 中出现大量的示例 DAG,让你专注于自己的业务逻辑。
AIRFLOW__CORE__LOAD_EXAMPLES: 'false'
#运行命令openssl rand -base64 42 生成一个强随机密钥,配置在.evn文件中
AIRFLOW__API_AUTH__JWT_SECRET=生成的长随机字符串密钥
#生成一个随机的 Fernet Key 并填入
#AIRFLOW__CORE__FERNET_KEY 配置为空字符串,后果非常严重,Airflow 将无法启动,或者启动后无法保存任何敏感信息
python -c "from cryptography.fernet import Fernet; print(Fernet.generate_key().decode())"
AIRFLOW__CORE__FERNET_KEY: 'XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX'
#修改对外暴漏的端口为8086
airflow-apiserver:
<<: *airflow-common
command: api-server
ports:
- "8086:8080"
#修改config/airflow.cfg中的配置,开启 Airflow 界面"测试连接"按钮
test_connection = Enabled
三 运行 AirFlow 容器
bash
#运行命令进行初始化,最终会返回"airflow-init-1 exited with code 0" 说明初始化成功
docker compose up airflow-init
docker-compose down
#重新启动,这次启动后airflow就能正式工作了
docker compose up -d
#
四 访问 AirFlow Web UI
在浏览器中打开 http://localhost:8086,使用之前创建的管理员用户名和密码登录。
参考资料:
【1】https://airflow.apache.org/docs/apache-airflow/stable/howto/docker-compose/index.html