IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> kettle 脚本批量替换数据库连接配置 -> 正文阅读

[大数据]kettle 脚本批量替换数据库连接配置

本质是对kettle脚本文件中的连接信息进行替换

脚本

import xmltodict
import json
import os

node_transformation = 'transformation'
node_job = 'job'

ext_ktr = '.ktr'
ext_kjb = '.kjb'


def get_file_content(file_path):
    with open(file_path, 'r', encoding='utf-8') as f:
        lines = f.readlines()
    # print(lines)
    return "".join(lines)


def save_file_content(file_path, content):
    with open(file_path, 'w', encoding='utf-8') as f:
        f.write(content)
    return True


def fix_xml(node, xml_dict):
    if isinstance(xml_dict[node]['connection'], dict):
        xml_dict[node]['connection'] = [xml_dict[node]['connection']]

    if node == node_transformation and isinstance(xml_dict[node]['step'], dict):
        xml_dict[node]['step'] = [xml_dict[node]['step']]


# 替换连接信息
def change_detail(node, xml_dict, config):
    for i, con_detail in enumerate(xml_dict[node]['connection']):
        for pair in config['details']:
            is_match = True
            for key, value in pair['old'].items():
                # print(key)
                # print(con_detail)
                if (value != con_detail[key]):
                    is_match = False
                    break
            if is_match:
                # 用新配置替换老配置
                for key, value in pair['new'].items():
                    xml_dict[node]['connection'][i][key] = value
                break


# 替换连接名称
def change_name(node, xml_dict, config):
    key = 'name'
    for i, con_detail in enumerate(xml_dict[node]['connection']):
        for pair in config['names']:
            if pair['old'] == con_detail[key]:
                xml_dict[node]['connection'][i][key] = pair['new']
                break

    key = 'connection'
    if node == node_transformation:
        for i, step in enumerate(xml_dict[node]['step']):
            for pair in config['names']:
                if pair['old'] == step[key]:
                    xml_dict[node]['step'][i][key] = pair['new']
                    break

    if node == node_job:
        for i, entry in enumerate(xml_dict[node]['entries']['entry']):
            for pair in config['names']:
                if key in entry and pair['old'] == entry[key]:
                    xml_dict[node]['entries']['entry'][i][key] = pair['new']
                    break


# 更新脚本中的数据库连接
def do_change_db(ext, old_script_path, new_script_path, config_path):
    config = json.loads(get_file_content(config_path))
    content = get_file_content(old_script_path)
    xml_dict = xmltodict.parse(content)

    if ext_ktr == ext:
        fix_xml(node_transformation, xml_dict)
        change_detail(node_transformation, xml_dict, config)
        change_name(node_transformation, xml_dict, config)
    if ext_kjb == ext:
        fix_xml(node_job, xml_dict)
        change_detail(node_job, xml_dict, config)
        change_name(node_job, xml_dict, config)

    save_file_content(new_script_path, xmltodict.unparse(xml_dict, pretty=True))


# 批量更新
def change_batch(dir_path, config_path):
    file_names = os.listdir(dir_path)
    for file_name in file_names:
        f, ext = os.path.splitext(file_name)
        print(f, ext)
        if ext_ktr == ext or ext_kjb == ext:
            file_path = os.path.join(dir_path, file_name)
            print('parsing:', file_path)
            do_change_db(ext, file_path, file_path, config_path)


if __name__ == '__main__':
    dir_path = 'D:/xxx/xxx'
    config_path = 'config.json'

    change_batch(dir_path, config_path)

配置文件

{
    "names":
        [
            {
                "old":"xxx",
                "new":"xxx"
            },
            {
                "old":"xxx",
                "new":"xxx"
            }
        ],
    "details":
        [
            {
                "old":
                    {
                        "server": "xxx",
                        "type": "POSTGRESQL",
                        "access": "Native",
                        "database": "xxx",
                        "port": "5432",
                        "username": "postgres",
                        "password": ""
                    },
                "new":
                    {
                        "server": "xxx",
                        "type": "POSTGRESQL",
                        "access": "Native",
                        "database": "xxx",
                        "port": "5432",
                        "username": "xxx",
                        "password": ""
                    }
            },
            {
                "old":
                    {
                        "server": "xxx",
                        "type": "POSTGRESQL",
                        "access": "Native",
                        "database": "xxx",
                        "port": "5432",
                        "username": "xxx",
                        "password": ""
                    },
                "new":
                    {
                        "server": "xxx",
                        "type": "POSTGRESQL",
                        "access": "Native",
                        "database": "xxx",
                        "port": "5432",
                        "username": "xxx",
                        "password": ""
                    }
            }
        ]
}

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-04-09 18:28:13  更:2022-04-09 18:30:22 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 4:26:40-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码