IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> python pandas+sqlalchemy导入Excel数据到MySQL -> 正文阅读

[大数据]python pandas+sqlalchemy导入Excel数据到MySQL

pandas+sqlalchemy导入Excel数据到MySQL

excel 文件内容

prov:省份
city:城市
在这里插入图片描述

数据库结构

CREATE TABLE `big_data_area` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` varchar(255) NOT NULL COMMENT '省份或城市名称',
  `type` int(1) NOT NULL COMMENT '类型 1:省份 2:城市',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='大数据省市数据';

程序

class ExportData(object):
    def __init__(self):
        # 数据库方言
        self.DIALECT = 'mysql'
        # 驱动
        self.DRIVER = 'pymysql'
        # 用户名
        self.USERNAME = 'root'
        # 密码
        self.PASSWORD = 'root'
        # 数据库地址
        self.HOST = '127.0.0.1'
        # 端口号
        self.PORT = 3306
        # 数据库名称
        self.DATABASE = 'test'
        # 字符编码
        self.CHARSET = 'utf8'
        self.SQLALCHEMY_DATABASE_URI = "{}+{}://{}:{}@{}:{}/{}?charset={}".format(self.DIALECT, self.DRIVER, self.USERNAME, self.PASSWORD, self.HOST, self.PORT, self.DATABASE, self.CHARSET)
        self.SQLALCHEMY_TRACK_MODIFICATIONS = True
        self.connect = create_engine(self.SQLALCHEMY_DATABASE_URI)

    def export_excel(self):
        # 提取Excel中的数据集
        df = pd.read_excel('C:\\Users\\Administrator\\Documents\\pro_city.xlsx', sheet_name='sheet1')
        # 省份
        self.data_handler(df, 1)
        # 城市
        self.data_handler(df, 2)

    def data_handler(self, data, type_value):
        # 通过类型值设置字段名称
        if type_value == 1:
            field = 'prov'
        elif type_value == 2:
            field = 'city'
        else:
            raise Exception("类型值错误")
        # 提取数据集中特定字段的列
        df = data[[field]]
        # 对数据集进行去重
        df = df.drop_duplicates([field])
        # 设置type字段的值
        df['type'] = type_value
        # 重新设置字段
        df.columns = ['name', 'type']
        print(df)
        # big_data_area: 表名,self.connect: 数据库链接 if_exists='append': 表示有相同的数据时追加到表内,index=False: 表示忽略索引
        pd.io.sql.to_sql(df, 'big_data_area', self.connect, if_exists='append', index=False)
        print("导入数据{}成功!".format(field))


if __name__ == '__main__':
    exportData = ExportData()
    exportData.export_excel()

运行结果

在这里插入图片描述
在这里插入图片描述

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-11-18 11:15:08  更:2021-11-18 11:16:57 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/17 21:57:30-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码