IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> windows 安装dataX -> 正文阅读

[Python知识库]windows 安装dataX

首先本地需要安装好 jdk 、 maven 、 python的基础环境,如果安装过程有问题可以参考百度对应的教程,这里就不多说了。
在这里插入图片描述

  1. DataX源码下载DataX 源码路径,下载压缩包解压到本地目录。
    http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz
    在这里插入图片描述

  2. 将datax压缩包解压在安装目录
    在这里插入图片描述
    安装完成,如果环境是Python3,则需要修改datax/bin下面的三个python文件。如果是Python2则不需修改。(修改需要的文件链接:https://github.com/WeiYe-Jing/datax-web/tree/master/doc/datax-web/datax-python3

  3. 全部完成后,测试DataX
    打开DOS命令行,进入DataX安装目录的bin文件夹,执行语句python2 datax.py …/job/job.json 注:python2是我自己改的名字,为了区别python3 运行结果如果最后出现乱码,在DOS命令行输入 CHCP 65001

python datax.py ../job/job.json

(job.json的绝对地址在datax/job文件夹下。)

运行成功
在这里插入图片描述

  1. 配置json文件
{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "postgresqlreader",
                    "parameter": {
                        "column": [
                           "*"
                        ],
                        "connection": [
                            {
                                "jdbcUrl": ["jdbc:postgresql://xxxxxx:5432/pg_temp?useUnicode=true&characterEncoding=utf8"],   
                          		"table": ["wmsc.erp_item_rcv_puton","wmsc.fg_inspect"]					
                            
                            }
                        ],
                        "password": "gpadmin",
                        "username": "gpadmin"
                    }
                },
                "writer": {
                    "name": "postgresqlwriter",
                    "parameter": {
                        "column": [
                           "*"
                        ],
                        "preSql": [
                          "TRUNCATE TABLE @table"
                        ],
                        "connection": [
                            {
                                "jdbcUrl": "jdbc:postgresql://xxxxxx:5432/PG_TEMP?useUnicode=true&characterEncoding=utf8",
                                "table": ["wmsc.erp_item_rcv_puton","wmsc.fg_inspect"]
                            }
                        ],
                        "password": "postgres123",
                        "username": "postgres"
                    },
					 "encoding":"utf-8"
                }
            }
        ],
        "setting": {
            "speed": {
                "channel": 1
           }
        }
    }
}
  1. 批量导表数据
    修改json
{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "postgresqlreader",
                    "parameter": {
                        "column": [
                           "*"
                        ],
                        "connection": [
                            {
                                "jdbcUrl": ["jdbc:postgresql://xxxx:5432/pg_temp?useUnicode=true&characterEncoding=utf8"],   
                          		"table": ["${schema}.${table}"]					
                            
                            }
                        ],
                        "password": "gpadmin",
                        "username": "gpadmin"
                    }
                },
                "writer": {
                    "name": "postgresqlwriter",
                    "parameter": {
                        "column": [
                           "*"
                        ],
                        "preSql": [
                          "TRUNCATE TABLE @table"
                        ],
                        "connection": [
                            {
                                "jdbcUrl": "jdbc:postgresql://xxxx:5432/PG_TEMP?useUnicode=true&characterEncoding=utf8",
                                "table": ["${schema}.${table}"]
                            }
                        ],
                        "password": "postgres123",
                        "username": "postgres"
                    },
					 "encoding":"utf-8"
                }
            }
        ],
        "setting": {
            "speed": {
                "channel": 1
           }
        }
    }
}

是变量

${schema}.${table}

-Dschema 对应 schema
-Dtable 对应 table

python datax.py ..\job\gp-pg.json -p"-Dschema=wms -Dtable=wms_material_info" --jvm="-Xms8G -Xmx8G"

查询整个库的表和表里面的数量

SELECT pt.*,reltuples as rowCounts FROM pg_tables pt left join pg_class pc on pc.relname = pt.tablename and pc.relkind = 'r' where tablename NOT LIKE 'pg%' AND tablename NOT LIKE 'sql_%' ORDER BY tablename;

查询整个库的表

SELECT * FROM pg_tables WHERE tablename NOT LIKE 'pg%' AND tablename NOT LIKE 'sql_%' ORDER BY tablename;

查询表里面的数量

select relname as TABLE_NAME, reltuples as rowCounts from pg_class where relkind = 'r' order by rowCounts desc

错误

在这里插入图片描述
解决方式:
把工具包中的 plugins里所有带下划线开头的,全删掉
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2022-02-28 15:25:00  更:2022-02-28 15:27:26 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/15 23:18:35-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码