IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> airflow中log表详解 -> 正文阅读

[大数据]airflow中log表详解


标题: airflow中log表详解
日期: 2021-11-08 21:03:15
标签: [airflow, log]
分类: 调度系统

上次介绍了airflow元数据库表的大致作用,是干什么的,存储了哪些信息,接下来,我们就来一个一个介绍,表里面的字段是什么意思,我们怎么使用。

airflow-logo

图片来自pexels

这是表结构:

fieldtypenullkeydefaultextra
idint(11)NOPRI(NULL)auto_increment
dttmtimestamp(6)YES
dag_idvarchar(250)YESMUL
task_idvarchar(250)YES
eventvarchar(30)YES
execution_datetimestamp(6)YES
ownervarchar(500)YES
extratextYES

下面来一个个字段介绍。

  • id:自增主键
  • dttm:操作时间
  • dag_id:操作的dag_id,有可能为空,因为如果是airflow自动调度,或者是在命令行操作airflow,不针对某个单独的dag时,此字段就是空的;
  • task_id:类似dag_id,操作的不是task,那么该字段就是空的;
  • event
eventdescription
clearairflow页面上clear dag_run或者clear task,该动作是人为操作
cli_clearairflow命令方式clear dagrun:airflow clear dag_id -s start_date -e end_date
cli_create_userairflow create_user命令创建用户
cli_flowerairflow flower命令启动flower监控
cli_runairflow命令run dag
cli_schedulerairflow scheduler命令启动scheduler
cli_serve_logsairflow worker命令启动日志服务
cli_upgradedbairflow upgradedb命令升级数据库
cli_versionairflow version命令查看版本
cli_webserverairflow webserver命令启动webserver服务
cli_workerairflow worker命令启动worker
dagrun_successairflow页面标记dagrun为success的动作,该动作是人为操作
deleteairflow页面删除dag,该动作是人为操作
durationairflow页面查看task运行时长,该动作是人为操作
extra_linksairflow页面查看task的超链接,该动作是人为操作
failedairflow页面标记task失败,该动作是人为操作
ganttairflow页面查看task的甘特图,该动作是人为操作
get_logs_with_metadata不知道,应该跟查看日志有关
graphairflow页面查看graph图,该动作是人为操作
landing_timesairflow页面查看task运行结束时间统计图,该动作是人为操作
logairflow页面查看日志,该动作是人为操作
pausedairflow页面on/off dag,该动作是人为操作
refreshairflow页面refresh刷新dag,该动作是人为操作
renderedairflow页面查看渲染的变量,该动作是人为操作
runairflow页面run某个task,该动作是人为操作
runningairflow调度task,将task标记为running的动作,该动作是系统操作
successairflow页面标记task为success的动作,该动作是人为操作
task不知道,airflow task,应该是记录的airflow的task
treeairflow页面查看task结构树,该动作是人为操作
triesairflow页面查看task重试次数,该动作是人为操作
triggerairflow页面trigger dag任务,该动作是人为操作
xcomairflow页面查看task push或者pull的变量,xcom的功能后面讲如何使用,作用就是task之间传递数据用的功能。
  • execution_date:dag的计划执行时间
  • owner:操作的airflow用户,如果是命令操作,则是linux用户
  • extra:记录的是操作日志的命令信息

dog

总结:

  1. cli_前缀的event,标识通过命令方式操作airflow;
  2. 用户在页面的操作,每一个点击都会被记录为日志;
  3. airflow scheduler worker两个角色也可以认为是用户,也有对dag、task的操作记录;

好了,airflow元数据表log介绍完了。

有什么问题或者疑问,都可以跟我发邮件,欢迎一起讨论。

我会将三年的airflow经验分享出去,主要就是为了记录一下我的知识,并分享给你们。

后面继续介绍airflow元数据库的其他表。

再见。


书山有路勤为径,学海无涯苦作舟。

欢迎关注我的微信公众号,比较喜欢分享知识,也喜欢宠物,所以做了这2个公众号:
程序员写书

喜欢宠物的朋友可以关注:【电巴克宠物Pets】
电巴克宠物

一起学习,一起进步。

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-11-09 19:37:22  更:2021-11-09 19:38:34 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 4:45:44-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码