IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Java知识库 -> Kettle 数据抽取【Version 6.1】 -> 正文阅读

[Java知识库]Kettle 数据抽取【Version 6.1】

背景

需要按一定规则从数据库抽取量比较大的数据。使用ETL工具完成。

简述

Kettle是国外开源的ETL工具,Java编写。后来改名PDI
转换(transformation)和工作(job)的区别:

转换是数据流,工作是步骤流,作业的每个步骤必须等前面的步骤都跑完了,后面的步骤才会执行,而转换会一次性把所有控件启动(一个控件对应一个线程)然后数据流会从第一个控件开始,一条记录一条记录地流向后面的控件。

安装使用

安装

绿色无需安装,下载解压就能使用。

设置系统变量(KETTLE_HOME)

PDI的默认配置文件保存在用户目录下的.kettle目录的kettle.properties文件中(C:\Users\Administrator\ .kettle)

设置KETTLE_HOME环境变量的值是:D:\Program Files\pdi-ce-9.1.0.0-324。重启之后在D:\Program Files\pdi-ce-9.1.0.0-324.kettle目录下可以看到kettle.properties配置文件。

使用

双击 Spoon.bat 启动
在这里插入图片描述
Kettle提供3种资源库,分别是数据库资源库、Pentaho资源库和文件资源库,本文以文件资源库为例。
工具->资源库->连接资源库 【CTRL+R】
在这里插入图片描述
刷新资源库【CTRL+E】
在这里插入图片描述

首先创建一个“工作”,建立一个简单的工作流

在这里插入图片描述
进入转换,进行具体操作
在这里插入图片描述

表输入注意点

  • 如果sql中使用变量,替换变量选项一定要勾。
  • 返回数据类型如果有int,double类型数据,转为字符串类型。默认识别可能会丢失精度
    在这里插入图片描述

在这里插入图片描述

文本文件输出注意点

  • 需求为输出为CSV文件,使用UTF-8编码会造成中文乱码。改为GBK解决中文乱码
  • 字段获取的时候,要点一下最小宽度。不点的情况下,默认识别数据的宽度不确定(如果数据不够宽度以空格填充)这样会造成文件太大。浪费空间。
    在这里插入图片描述

在这里插入图片描述

循环

设置参数

在这里插入图片描述
在这里插入图片描述
接下来使用一个JOB循环

循环job注意点

  • 高级设置 要勾选对每个输入行执行一次?
    在这里插入图片描述
    job中接收获取参数
    在这里插入图片描述
    在这里插入图片描述

java代码

在这里插入图片描述
在这里插入图片描述

java代码注意点

如果要对值做转换,需要一个新属性来接受,不能在原属性覆盖
此处gd_lat—>使用lat_84接收

压缩文件

在这里插入图片描述

压缩文件注意点

压缩文件,如果(高级设置)zip存在的情况下,没有覆盖的功能。所以要在压缩之前加一个删除文件。避免不压缩

邮件控件

在这里插入图片描述

发送邮件,要配合【添加文件到结果文件中】使用

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

资源

Kettle 压缩包,数据库驱动jar,坐标转换工具类jar,java代码

  Java知识库 最新文章
计算距离春节还有多长时间
系统开发系列 之WebService(spring框架+ma
springBoot+Cache(自定义有效时间配置)
SpringBoot整合mybatis实现增删改查、分页查
spring教程
SpringBoot+Vue实现美食交流网站的设计与实
虚拟机内存结构以及虚拟机中销毁和新建对象
SpringMVC---原理
小李同学: Java如何按多个字段分组
打印票据--java
上一篇文章      下一篇文章      查看所有文章
加:2021-08-06 09:29:41  更:2021-08-06 09:30:07 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/12 6:28:33-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码