抽取CSV文件
- CSV数据转存的特定实现规则
实现规则 |
---|
文件开头不能留空,以“行”为单位 | 文件可含或不含列名,若含有列名,则位于文件第一行 | 文件中的一行数据不能跨行,行与行之间不可存在空格 | 文件中以英文半角逗号(即“,”)作为分隔符,若列为空,也要表达列的存在 | 文件中的列的内容,若存在英文半角单引号,则替换成半角双引号进行转义,因为在抽取数据时,通过使用半角双引号将所有的字符串内容引起来 | 在文件读写时,引号和逗号操作规则可以互逆 | 文件中的编程格式不做吸纳之,可以时ASCII,也可以是Unicode或者UTF-8等编码格式 | 文件中不支持数字或者特殊符号 |
- 转换步骤
打开Kettle工具创建一个转换,如图一所示: 配置“CSV文件输入”控件最后结果界面如图二所示: 数据预览图如图三所示: 配置“表输出”控件成功界面如图四所示: 通过SQLyog查看数据表成功插入数据的结果如图五所示: - 注意:做转换前数据库和表均应提前创建
创建数据库参考代码: 创建表参考代码:
抽取JSON文件
- 打开Kettle创建转化如图八所示:
- 配置JSON input 控件
- JSON input 2 控件的配置(与JSON input 相似)
- 配置“表输出”控件
- 通过SQLyog工具查看json插入数据的结果
- JSON表也需提前创建,参考代码如下:
|