| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 大数据 -> 大数据调度平台Airflow(三):Airflow单机搭建 -> 正文阅读 |
|
[大数据]大数据调度平台Airflow(三):Airflow单机搭建 |
目录 2、将下载好的anconda安装包上传至mynode4节点,进行安装 Airflow单机搭建Airflow是基于Python的,就是Python中的一个包。安装要求Python3.6版本之上,Metadata DataBase支持PostgreSQL9.6+,MySQL5.7+,SQLLite3.15.0+。 一、安装Anconda及python3.71、官网下载Anconda ,选择linux版本,并安装下载官网地址:https://www.anaconda.com/products/individual#macos 2、将下载好的anconda安装包上传至mynode4节点,进行安装
3、配置Anconda的环境变量
4、安装python3.7 python环境
5、激活使用python37 python环境
相关命令如下:
二、单机安装Airflow单节点部署airflow时,所有airflow 进程都运行在一台机器上,架构图如下: 1、安装Airflow必须需要的系统依赖Airflow正常使用必须需要一些系统依赖,在mynode4节点上安装以下依赖:
2、在MySQL中创建对应的库并设置参数aiflow使用的Metadata database我们这里使用mysql,在node2节点的mysql中创建airflow使用的库及表信息。
在mysql安装节点node2上修改”/etc/my.cnf”,在[mysqld]下添加如下内容:
注意:以上配置explicit_defaults_for_timestamp 系统变量决定MySQL服务端对timestamp列中的默认值和NULL值的不同处理方法。此变量自MySQL 5.6.6 版本引入,默认值为0,在默认情况下,如果timestamp列没有显式的指明null属性,那么该列会被自动加上not null属性,如果往这个列中插入null值,会自动的设置该列的值为current timestamp值。当这个值被设置为1时,如果timestamp列没有显式的指定not null属性,那么默认的该列可以为null,此时向该列中插入null值时,会直接记录null,而不是current timestamp,如果指定not null 就会报错。 在Airflow中需要对应mysql这个参数设置为1。以上修改完成“my.cnf”值后,重启Mysql即可,重启之后,可以查询对应的参数是否生效:
3、安装Airflo在node4上切换python37环境,安装airflow,指定版本为2.1.3
默认Airflow安装在$ANCONDA_HOME/envs/python37/lib/python3.7/site-packages/airflow目录下。Airflow文件存储目录默认在/root/airflow目录下,但是这个目录需要执行下“airflow version”后自动创建,查看安装Airflow版本信息:
注意:如果不想使用默认的“/root/airflow”目录当做文件存储目录,也可以在安装airflow之前设置环境变量:?
?这样安装完成的airflow后,查看对应的版本会将“AIRFLOW_HOME”配置的目录当做airflow的文件存储目录。 4、配置Airflow使用的数据库为MySQL打开配置的airflow文件存储目录,默认在$AIRFLOW_HOME目录“/root/airflow”中,会有“airflow.cfg”配置文件,修改配置如下:
5、安装需要的python依赖包初始化Airflow数据库时需要使用到连接mysql的包,执行如下命令来安装mysql对应的python包。
6、初始化Airflow 数据库
?初始化之后在MySQL airflow库下会生成对应的表。 7、创建管理员用户信息在node4节点上执行如下命令,创建操作Airflow的用户信息:
?执行完成之后,设置密码为“123456”并确认,完成Airflow管理员信息创建。 三、启动Airflow1、启动webserver
2、启动scheduler新开窗口,切换python37环境,启动Schduler:
3、访问Airflow webui浏览器访问:http://node4:8080? ?输入前面创建的用户名:airflow 密码:123456
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/24 6:18:23- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |