Apache Airflow (三) :Airflow WebUI操作介绍

🏡 个人主页IT贫道_大数据OLAP体系技术栈,Apache Doris,Clickhouse 技术-CSDN博客

🚩 私聊博主:加入大数据技术讨论群聊,获取更多大数据资料。

🔔 博主个人B栈地址:豹哥教你大数据的个人空间-豹哥教你大数据个人主页-哔哩哔哩视频


目录

[1. DAG](#1. DAG)

[2. Security](#2. Security)

[​​​​​​​3. Browse](#3. Browse)

[​​​​​​​4. Admin](#4. Admin)

[​​​​​​​5. Doc](#5. Doc)s


1. DAG

DAG有对应的id,其id全局唯一,DAG是airflow的核心概念,任务装载到DAG中,封装成任务依赖链条,DAG决定这些任务的执行规则。

点击以上每个DAG对应的id可以直接进入对应"Graph View"视图,可以查看当前DAG任务执行顺序图。

以上"Runs"列与"Recent Tasks"列下的"圆圈"代表当前DAG执行的某种状态,鼠标放到对应的"圆圈"上可以查看对应的提示说明。点击以上"Links"之后,出现以下选项:

  • Tree View

将DAG以树的形式表示,如果执行过程中有延迟也可以通过这个界面查看问题出现在哪个步骤,在生产环境下,经常通过这个页面查看每个任务执行情况。

点击以上每个有颜色的"小块"都可以看到task详情:

  • Graph View

此页面以图形方式呈现DAG有向无环图,对于理解DAG执行非常有帮助,不同颜色代表task执行的不同状态。

点击任意一个task,都可以看到当前task执行情况:

  • Calendar View

日期视图,显示当前年每月每天任务执行情况。

  • Task Duration

此视图表示不同的task在过去每天执行的时长,可以通过每日执行时长对比,发现同一个task执行耗时情况。

  • Task Tries

此视图显示每个task重试次数情况。

  • Landing Times

Landing Times显示每个任务实际执行完成时间减去该task定时设置调度的时间,得到的小时数,可以通过这个图看出任务每天执行耗时、延迟情况。

以上得到的"Landing Times"如下:

  • Gantt

甘特图,可以通过甘特图来分析task执行持续时间和重叠情况,可以直观看出哪些task执行时间长。

  • Details

可以通过"Details"发现任务详细情况。

  • Code

Code页面主要显示当前DAG python代码编码,当前DAG如何运行以及任务依赖关系、执行成功失败做什么,都可以在代码中进行定义。

2. ​​​​​​​Security

"Security"涉及到Airflow中用户、用户角色、用户状态、权限等配置。

​​​​​​​3. Browse

  • DAG Runs

显示所有DAG状态

  • Jobs

显示Airflow中运行的DAG任务

  • Audit Logs

审计日志,查看所有DAG下面对应的task的日志,并且包含检索。

  • Task Instances

查看每个task实例执行情况。

  • Task Reschedules

Task 重新调度的实例情况。

  • SLA Misses

如果有一个或者多个实例未成功,则会发送报警电子邮件,此选项页面记录这些事件。

  • DAG Dependencies

查看DAG任务对应依赖关系。

​​​​​​​4. Admin

在Admin标签下可以定义Airflow变量、配置Airflow、配置外部连接等。

​​​​​​​5. Docs

Docs中是关于用户使用Airflow的一些官方使用说明文档连接。


相关推荐
IT贫道1 年前
Apache Airflow (十四) :Airflow分布式集群搭建及测试
airflow
IT贫道1 年前
Apache Airflow (十一) :HiveOperator及调度HQL
airflow
IT贫道1 年前
Apache Airflow (十三) :Airflow分布式集群搭建及使用-原因及
airflow
IT贫道1 年前
Apache Airflow (九) :Airflow Operators及案例之BashOperator及调度Shell命令及脚本
airflow
IT贫道1 年前
Apache Airflow (八) :DAG任务依赖设置
airflow
IT贫道1 年前
Apache Airflow (二) : Airflow单机搭建
airflow