| |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| -> 大数据 -> datax关系/图数据库(neo4j)插件设计与实现 -> 正文阅读 |
|
|
[大数据]datax关系/图数据库(neo4j)插件设计与实现 |
背景DataX是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。解决异构数据源同步问题,DataX将复杂的网状的同步链路变成了星型数据链路,DataX作为中间传输载体负责连接各种数据源。当需要接入一个新的数据源的时候,只需要将此数据源对接到DataX,便能跟已有的数据源做到无缝数据同步。 图库是属于newsql/nosql, 近几年应用火热的数据库类型,广泛用于金融风控,社交,制造等领域 datax没有实现图数据库相关插件,但datax提供很好的插件机制,可自行实现 参考和术语ETL Extract-Transform-Load的缩写, 数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端 图数据库 datax原理介绍
?*官方图,Transport处是Channel,本人觉得不太准确,应为Transport > 作业分解为任务,任务分组,最后调度器调度任务(组) *作业分片和任务分组没有在高可用中 > 调度器负责分派资源执行任务(组),TaskEecutor执行任务 > transport包括数据交换(exchanger),数据转换(transformer),交换数据字节数/记录数的统计(channel) 关系/图数据库插件架构设计
数据同步分3步 0. 模式(schema)转换构建,并输出,序列化或数据库持久 1. 表数据同步,datax表模式,schema表写入datax的表模式配置 2. 表关系同步,按表表连接图分组,一对关系一组,表连接关系生成querySql,写入写入datax的querySql模式配置 其中后两步DataX执行,作业驱动两个datax作业串行 关系(oracle)数据和图数据映射策略这里展示的是oracle,mysql/sqlserver类似
映射策略,oracle<->neo4j
*oracle模型注释没有合适映射 *neo4j索引还有以下特性,oracle没有对应特性转换: 1. 提供者(provider),索引的技术实现, 如,native-btree-1.0 and lucene+native-3.0等 2. text ?index lookup ?index(since v4.3) full-text ?index 详细设计schema转换组件(schema-transformer)
?模式转换设计
?schema转换器以图方式遍历schema,遍历到组件获取对应的映射器,映射为neo4j的schema mapping组件封装转换策略,参考关系(oracle)数据和图数据映射策略 数据同步(data-transformer)组件驱动两个datax作业 1. 第一个作业,表数据同步,datax table模式, schema的表写入datax的table模式配置;同时支持用户配置表,特别地,当用户配置单个表是,可使用datax的单表分片特性,该特性用于针对数据量超大的表 2. 第二个作业,表关系同步,按表连接图分组,一对关系一组,表连接关系生成querySql,写入datax的querySql模式配置
工程解释
|
|
|
|
|
| 上一篇文章 下一篇文章 查看所有文章 |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| 360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年12日历 | -2025/12/3 17:11:44- |
|
| 网站联系: qq:121756557 email:121756557@qq.com IT数码 |