| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 大数据 -> 大数据项目实战数仓4——总纲 -> 正文阅读 |
|
[大数据]大数据项目实战数仓4——总纲 |
文章目录一、数据仓库的概述数据仓库(Data Warehouse),是为企业制度决策,提供数据支持的。 二、项目需求及架构设计1.项目需求分析
2.项目框架2.1技术选型考虑因素:数据量大小、业务需求、行业内经验、技术成熟度、开发维护成本、总成本预算
2.2系统数据流程设计2.3框架发行版本选型Apache 2.4服务器选型这里选择阿里云主机,Centos7配置如下: 2.5集群资源规划设计(1)消耗内存的分开 (2)数据传输数据比较紧密的放在一起(Kafka、Zookeeper) (3)客户端尽量放在一到两台服务器上,方便外部访问 (4)有依赖关系的尽量放到同一台服务器(例如:Hive和Azkaban Executor) 三、相关命令可视化报表Superset1)切换到yingzi用户
2)启动superset.sh脚本
Web UI界面:http://hadoop102:8787 用户名:yingzi 密码:000000 即席查询Kylin依赖于Hadoop、Hive、Zookeeper、HBase 1)启动hadoop
2)启动zoookeeper
3)启动hbase
4)启动Kylin 在kylin用户下认证为hive主体
以kylin用户的身份启动kylin
Web UI:http://hadoop102:7070/kylin 用户名:ADMIN 日志:/opt/module/kylin/logs/kylin.log 集群监控Zabbixhadoop102启动
hadoop103、104启动
全流程调度Azkaban1)在三台主机上启动Executor
2)任选一台节点激活
3)启动Web Server
Web UI:http://hadoop102:8081/ 账号:yingzi 密码:123456 权限管理Ranger1)启动ranger-admin
Web UI:http://hadoop102:6080 账号:admin 密码:yingzi123 2)启动ranger-usersync(开机自启)
元数据管理Atlas1)在三台主机上启动solr集群
Web UI:http://hadoop102:8983 2)启动Atlas,依赖于Hadoop、Zookeeper、Kafka、Hbase、Solr
Web UI:http://hadoop102:21000 账号:admin 密码:admin 四、全流程调度+数据质量可视化1)启动日志采集通道
2)准备业务数据 修改hadoop102,hadoop103两台节点的/opt/module/applog/application.yml文件,修改业务日期
执行生成日志的脚本(执行完后可看hdfs上是否有相应数据)
将数据消费,存入数据库,修改/opt/module/db_log/application.properties
此时可以看数据库中是否有2020-??-??的数据 3)启动azkaban 为了减轻内存压力,可先释放一些进程
启动Executor Server(三台主机都需要)
激活Executor Server,任选一台节点执行
启动Web Server
Web UI:http://hadoop102:8081/ 账号:yingzi 密码:123456 4)分别启动gmall,data_supervisor的工作流程 在gmall上填入参数:dt,useExecutor 在data_supervisor上填入参数:dt,useExecutor,alert 5)可视化
Web UI页面:http://hadoop102:8787 用户名:yingzi 密码:000000 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/28 4:20:28- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |