IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> PG数据库和MYSQL数据库进行表的比对并输出相同和不同的表的数量 -> 正文阅读

[大数据]PG数据库和MYSQL数据库进行表的比对并输出相同和不同的表的数量

# -*- coding: utf-8 -*-
# !/usr/bin/python3
import logging
import pymysql
import psycopg2
import pandas as pd

logging.basicConfig(level=logging.INFO,
                    filename='./log.txt',
                    filemode='w',
                    format='%(asctime)s - %(filename)s[line:%(lineno)d] - %(levelname)s: %(message)s')

HOST = 'localhost'
MYSQL_PORT = 3306
MYSQL_USERNAME = 'mysql_username'
MYSQL_PASSWORD = 'mysql_password'
MYSQL_DB = 'database_name'

PG_PORT = 5432
PG_USERNAME = 'pg_username'
PG_PASSWORD = 'pg_password'
PG_DB = 'database_name'

# 打开数据库连接
mysql_conn = pymysql.connect(host=HOST, port=MYSQL_PORT, user=MYSQL_USERNAME, passwd=MYSQL_PASSWORD, db=MYSQL_DB)
pg_conn = psycopg2.connect(database=PG_DB, user=PG_USERNAME, password=PG_PASSWORD, host=HOST, port=PG_PORT)

# 使用 cursor() 方法创建一个游标对象 cursor
mysql_cursor = mysql_conn.cursor()
pg_cursor = pg_conn.cursor()

# 使用 execute()  方法执行 SQL 查询:两个数据库中bct的表
# 其中mysql只能获取到表,pg可以获取到表及表的记录数
mysql_cursor.execute("select table_name from information_schema.tables where table_schema = '" + MYSQL_DB + "';")
pg_cursor.execute("SELECT schemaname,relname,n_live_tup FROM pg_stat_user_tables ORDER BY n_live_tup DESC;")

# 表数据fetchall
mysql_data = mysql_cursor.fetchall()
pg_data = pg_cursor.fetchall()

# 转换成list形式
mysql_data = list(mysql_data)
pg_data = list(pg_data)

# 转换为dataframe
mysql_df = pd.DataFrame(mysql_data, columns=["table_name"])
pg_df = pd.DataFrame(pg_data, columns=["schemaname", "relname", "n_live_tup"])

# 储存mysql中bct的所有表和表的记录数  [{table:count},{table:count}……]
mysql_list = []

# 相等的表数
eq_count = 0
# 不相等的表数
neq_count = 0

logging.info('--------------------------------')
for index, mysql_row in mysql_df.iterrows():
    # 在此处循环搜索每个表的数据量,然后放入一个map中
    sql = "select count(*) as count from " + MYSQL_DB + "." + mysql_row['table_name'] + ";"
    mysql_cursor.execute(sql)
    mysql_count = pd.DataFrame(mysql_cursor.fetchone(), columns=['count'])['count'][0]
    mysql_list.append({mysql_row['table_name']: mysql_count})
    for index, pg_row in pg_df.iterrows():
        if pg_row['relname'].upper() == mysql_row['table_name'].upper():
            pgcount = pg_row['n_live_tup']
            if pgcount == mysql_count:
                eq_count = eq_count + 1
                logging.info(
                    'PG_table: ' + pg_row['relname'] + ' --> table_count is ' + str(pgcount) + ' == MYSQL_table: ' +
                    mysql_row['table_name'] + ' --> table_count is ' + str(mysql_count))
                print('PG_table: ' + pg_row['relname'] + ' --> table_count is ' + str(pgcount) + ' == MYSQL_table: ' +
                      mysql_row['table_name'] + ' --> table_count is ' + str(mysql_count))
            else:
                neq_count = neq_count + 1
                logging.info(
                    'PG_table: ' + pg_row['relname'] + ' --> table_count is ' + str(pgcount) + ' != MYSQL_table: ' +
                    mysql_row['table_name'] + ' --> table_count is ' + str(mysql_count))
                print('PG_table: ' + pg_row['relname'] + ' --> table_count is ' + str(pgcount) + ' != MYSQL_table: ' +
                      mysql_row['table_name'] + ' --> table_count is ' + str(mysql_count))

logging.info('--------------------------------')
logging.info('相等的表数为:' + str(eq_count))
logging.info('不相等的表数为:' + str(neq_count))
logging.info('--------------------------------')
print('相等的表数为:' + str(eq_count))
print('不相等的表数为:' + str(neq_count))

# 关闭数据库连接
mysql_conn.close()
pg_conn.close()
print('over')

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-03-12 17:36:19  更:2022-03-12 17:39:50 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/16 18:02:20-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码