IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 国产etl 与 ODI -> 正文阅读

[大数据]国产etl 与 ODI

安可项目(即国产化),我国信息、网安领域,能源行业及企业逐渐发力安可工程。安可工程是指安全可靠的工程,是用国产关键系统、关键软硬件产品及关键应用替代国外信息技术产品。国产化替代势在必行。本文就软件基础系统中间件产品ETL工具简要对比参考。

继系统集成、应用集成、业务集成之后,最头痛的数据集成(Data Integration)就Oracle的数据集成类工具。ODI(Oracle Data Integrator)与国产ETL工具灵蜂ETL产品(Beeload&BeeDI)功能相同与不同点 概述如下:

一、ODI?和 灵蜂ETL工具的相同点

  1. 两个工具都可以做数据同步工具,实现异构数据库的同步
  2. 两个工具都可以实现变化数据捕获
  3. 两个工具都Java技术实现
  4. 两个工具支持Web Service

二、ODI?和 灵蜂ETL工具的区别

  1. ODI的产品架构,太多的功能、性能依赖于数据库?。ODI他的强项应该是和具有强大处理能力来源于数据库结合在一起。(跟随Oracle、SQLserver?区别)。

? ? ? ? ?ODI?是Oracle在2006年收购Sunopsis。

? ? ? ? ? 国产ETL灵蜂ETL产品(Beeload&BeeDI)国产自研究核心独立软件产品原厂始于2004

? 2.?ODI使用ELT方式在数据整合过程中,它自己本身不执行数据整合的处理,所有的执行都是在 ? ? 现有的信息系统或者数据库中完成,不能出库。如Exadata,Teradata等,

  • ? ? 从技术实现讲,ODI属于应用层技术,可以和SOA?实现无缝集成

? ? ? ? ??国产ETL工具灵蜂产品(Beeload&BeeDI)是纯数据库层的应用,相对封闭,但安全、稳定

  • ?ODI?一般用于局域网内的数据整个传输,如果网络状况不好的广域网则不太适合数据传输,

? ? ? ? ?国产ETL工具灵蜂产品(Beeload&BeeDI)有非常好的数据传输机制,可以保证数据的传输精准一致性、性能。

  • ODI的UI设计最大的缺陷在于页面布局过分拥挤

国产ETL工具灵蜂产品(Beeload&BeeDI) 界面友好,简洁干净,适合国人开发人员和IT维护人员思维习惯

 三、ODI的主要功能特点有:

  1. 使用CDC作为变更数据捕获的捕获方式。?
  2. 代理支持并行处理和负载均衡。
  3. 完善的权限控制、版本管理功能。
  4. 支持数据质量检查,清洗和回收脏数据。
  5. 支持与JMS消息中间件集成。

? 四、灵蜂ETL工具变化数据捕获的优势

  1. 国产ETL工具灵蜂产品(Beeload&BeeDI)针对SQL server,DB2?都可以提供基于日志的CDC , ODI在开放系统上只支持Oracle基于日志的CDC,其他都用trigger。
  2. ?国产ETL工具灵蜂产品(Beeload&BeeDI)直接从数据库日志中通过自己专有程序抽取数据, 相对于ODI?对源系统的影响和权限要求很低
  3. 国产ETL工具灵蜂产品(Beeload&BeeDI)支持在备份系统上抓取变化数据,对以下数据类型如:LONG , XML , BLOB?提供支持ODI?的CDC?是不支持这些数据类型的
  4. 国产ETL工具灵蜂产品(Beeload&BeeDI)有很好的机制来保证传输的交易一致性和断点续传
  5. 数据仓库(中心)数据实时供给时ODI需要与OracleGoldGate (数据同步工具)结合使用
  • 下面几点是数据集成中经常遇到的场景,也成为了ODI最不适宜的场景。
  1. 文件处理

ODI本身并没有针对非结构化和半结构化数据转换为结构化或XML格式的功能,?只能通过编写Java程序,将Excel,PDF,Word转换为txt文档

? ?2. ?业务逻辑复杂,流程环节较多

? ? ? ?ODI无复杂工作流设计

? ?3. ?异构大数据量数据整合

? ? ? ? 如果数据量非常大,一旦遇到输出为文件,异构数据库间的数据整合,那么,ODI的性能就会受到影响

? 4. ?断点续传

? ? ? ?ODI完全不具备

? 5. 不同数据库间元数据转换,元数据交换和血缘分析

? ? ? 如Oracle表结构向Teradata的转换,ODI无法实现批量将Oracle建表DDL语法转换为Teradata建表DDL语法。只能编写程序完成该项工作)ODI无法直接实现列行转换,通过编写存储过程来实现

??6. 数据整合过程中需要数据质量分析

??????? ??ODI未有此功能

? 7.?需要更多的磁盘I/O

对于E-LT架构工具,只能依赖数据库的能力去完成,CPU和I/O都会成为瓶颈。


综上所述:ETL工具直接使用者的开发人员和IT维护人员需要:

  1. 产品化的工具通常会提供丰富的,最优性能的内置功能,尽可能少的减少额外程序的编写。
  2. 界面简洁,布局合理,在视觉效果上便于理解和使用,在使用上便于操作
  3. 性能高效:对产品工具必备刚性需求,工具价值本该在此。
  4. 即刻服务:?对工具操作快速上手,是决定项目高效实施直接因素。工欲善其事,必先利其器!

中国自主可控国产化的路径即是历史的必然,也是时代的脉搏。信息产业是巨大市场,每年全球信息计算终端市场规模近2万亿人民币,保卫信息安全刻不容缓,中国发展国产化自主可控堪称波澜壮阔的最伟大历程!

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-10-31 12:04:09  更:2022-10-31 12:05:21 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/28 6:48:02-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码