| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 大数据 -> 实时开发平台建设实践,深入释放实时数据价值丨04期直播回顾 -> 正文阅读 |
|
[大数据]实时开发平台建设实践,深入释放实时数据价值丨04期直播回顾 |
视频回顾:点击这里 课件获取:点击这里 一、实时数仓建设背景随着整体行业的数字化转型不断深入以及技术能力的不断提高,传统的 T+1 式(隔日)的离线大数据模式越来越无法满足新兴业务的发展需求,开展实时化的大数据业务,是企业深入挖掘数据价值的一条必经之路。 面对数字化转型下的数据快速产生、“小步快跑”的精细化运营及实时化和自动化的决策需求,如何提高实时数据处理能力将成为企业提升竞争力的一大因素。 而企业在建设实时数据应用时,又往往面临诸多困难:
为了解决这些问题,我们在实时建设过程中需要确定建设方式和建设目标,帮助企业更好的实现实时数仓建设。 二、实时数仓建设方法论如何帮助企业建设实时数仓,我们主要从以下四个步骤入手: 1、明确需求企业进行实时数仓建设的第一步是明确需求,需求需要业务需求和技术需求想结合。 1)业务需求方面:
2)技术需求方面:
2、技术选型第二步技术选型阶段,技术选型包括四个方面的选型: a、整体技术路线 b、采集工具 c、消息中间件+计算引擎及 d、维表、结果表的存储数据库 3、数仓设计与开发第三步是数仓设计与开发,包含一下三个方面: a、实时数仓分层设计 b、开发规范 c、代码开发与调试 4、管理与监控第四步是管理与监控,可以从任务发布、运行监控与告警、实时数据治理这3个部分入手。 三、基于数栈实时开发平台建设实时数仓分享完实时数仓的建设方法论,接下来来为大家分享实时数仓的建设流程。 第一步:实时采集基于Chunjun(原FlinkX)对数据库进行CDC采集,实现采集工具化,可对主流数据源进行CDC(日志数据)和通过JDBC(间隔轮询)两种实时采集方式。 1、CDC读取读取数据库日志的方式,对源库无压力 2、JDBC读取面向不开放数据库日志的场景,通过高频率的JDBC轮询读取数据,要求有自增字段 第二步:数据开发1、数据开发基础功能现在展示的是数据开发的一些基础功能,包括:WEB SQL IDE、可视化建表、维表缓存策略及系统&自定义函数,丰富的底层组件封装,界面化操作,降低开发门槛,使开发人员专注于业务逻辑处理。 2、数据开发高阶功能除了数据开发的基础功能之外,还有面向特定行业或场景的高阶配置,包括自动重试、自动启停、脏数据管理。 第三步:发布上线开发完毕之后就是任务的发布上线,发布上线包括任务调试和任务导入导出两个方面。 第四步:任务运维任务运维就是全局掌控任务的运行,对于一些异常或紧急情况进行处理的过程。 上述的实时数仓建设过程,其实正是袋鼠云自研的数栈实时开发StreamWorks产品的落地实践过程。 云原生一站式大数实时开发平台(StreamWorks),面向实时数仓构建的云原生一站式大数据实时开发平台,实现从实时数据采集、实时数据处理、任务监控运维的全链路覆盖。支持Flink多版本引擎、Kubernetes资源调度,提供丰富的运维监控曲线,助力企业实时化转型。 同时产品具备以下特点:
内含实时开发全链路工具,采集、计算、运维一体,降低客户使用成本,降低实时计算门槛。
支持输出自研Hadoop集群,同时可对接CDH、HDP、TDH等多集群及Oracle、TiDB等多引擎;节点资源可根据计算存储需求快速弹性伸缩,业务需求稳定响应。
支持Flink批流一体式采集+开发, 集成Iceberg,赋能一体式湖仓建设模式。
平台提供任务跨环境发布、代码调试、SQL校验、提交检查、自动启停、批量连接现存任务等丰富功能
在支持YARN+HDFS的基础上,同时支持Kubernetes资源调度、MinIO、OSS等对象存储 同时产品具备3大价值:
兼容了多版本引擎、适配多种数据源,封装集成为可视化操作界面。基于Web IDE,图像化配置表信息并使用SQL语言进行开发,降低整体上手门槛
提供任务全生命周期的可视化运维。全链路拓扑、丰富Metirc曲线展示、多方式多渠道任务告警,帮助用户搭建全面运维体系,提高运维保障。
协助企业构建实时数仓,建设实时数据标准及规范。搭建一套实时任务调度、任务运行监控及实时任务可靠恢复机制于一体的实时数据平台,保障数据质量,提供统一标准的数据出口。 四、实时数仓建设案例接下来我们分享两个使用客户的实际案例,为大家介绍实时开发平台如何切实的帮助客户解决问题。
五、数栈批流一体架构解析最后我们为大家介绍一段拓展资料,关于数栈批流一体架构的解析。
原文来源:VX公众号“数栈研习社” |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/23 16:29:00- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |