IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> MySQL之如何复制一张表的数据 -> 正文阅读

[大数据]MySQL之如何复制一张表的数据

写在前面

在工作中经常会遇到需要拷贝一个表的数据的场景,本文就一起来看下常用的方法都有哪些,如下准备测试数据:

drop database db1;
drop database db2;
create database db1;
use db1;

create table t(id int primary key, a int, b int, index(a))engine=innodb;
delimiter ;;
  create procedure idata()
  begin
    declare i int;
    set i=1;
    while(i<=1000)do
      insert into t values(i,i,i);
      set i=i+1;
    end while;
  end;;
delimiter ;
call idata();

create database db2;
create table db2.t like db1.t;

1:mysqldump+source

1.1:mysqldump导出db1.t的数据

[root@localhost tmp]# mysqldump -h127.0.0.1 -P3306 -uroot -p --add-locks=0 --no-create-info --single-transaction  --set-gtid-purged=OFF db1 t --where="a>900" --result-file=/tmp/t.sql
[root@localhost tmp]# cat /tmp/t.sql 
...
INSERT INTO `t` VALUES (901,901,901),(902,902,902),(903,903,903),(904,904,904),(905,905,905),(906,906,906),(907,907,907),(908,908,908),(909,909,909),(910,910,910),(911,911,911),(912,912,912),(913,913,913),(914,914,914),(915,915,915),(916,916,916),(917,917,917),(918,918,918),(919,919,919),(920,920,920),(921,921,921),(922,922,922),(923,923,923),(924,924,924),(925,925,925),(926,926,926),(927,927,927),(928,928,928),(929,929,929),(930,930,930),(931,931,931),(932,932,932),(933,933,933),(934,934,934),(935,935,935),(936,936,936),(937,937,937),(938,938,938),(939,939,939),(940,940,940),(941,941,941),(942,942,942),(943,943,943),(944,944,944),(945,945,945),(946,946,946),(947,947,947),(948,948,948),(949,949,949),(950,950,950),(951,951,951),(952,952,952),(953,953,953),(954,954,954),(955,955,955),(956,956,956),(957,957,957),(958,958,958),(959,959,959),(960,960,960),(961,961,961),(962,962,962),(963,963,963),(964,964,964),(965,965,965),(966,966,966),(967,967,967),(968,968,968),(969,969,969),(970,970,970),(971,971,971),(972,972,972),(973,973,973),(974,974,974),(975,975,975),(976,976,976),(977,977,977),(978,978,978),(979,979,979),(980,980,980),(981,981,981),(982,982,982),(983,983,983),(984,984,984),(985,985,985),(986,986,986),(987,987,987),(988,988,988),(989,989,989),(990,990,990),(991,991,991),(992,992,992),(993,993,993),(994,994,994),(995,995,995),(996,996,996),(997,997,997),(998,998,998),(999,999,999),(1000,1000,1000);
...

如果不想要values中包含多行,可以增加参数–skip-extended-insert,但是一般不需要,因为values多行的插入速度是要优于单value的。

主要参数说明如下:

--add-locks=0:输出文件中不要增加Lock table t write
--no-create-info:不要建表语句
--single-transaction:不对表t叫表锁,而是使用一致性视图
--set-gtid-purged=OFF:不输出gtid相关的信息
--where="a>900":过滤条件
--result-file:要写入的目标文件

1.2:source导入数据

[root@localhost tmp]# mysql -h127.0.0.1 -P3306 -uroot -p db2 -e "select count(*) from t"
Enter password: 
+----------+
| count(*) |
+----------+
|        0 |
+----------+
[root@localhost tmp]# mysql -h127.0.0.1 -P3306 -uroot -p db2 -e "source /tmp/t.sql"
Enter password: 
[root@localhost tmp]# mysql -h127.0.0.1 -P3306 -uroot -p db2 -e "select count(*) from t"
Enter password: 
+----------+
| count(*) |
+----------+
|      100 |
+----------+

source是客户端命令,执行流程如下:

1:解析文件,以分号为结尾,读取一条条的sql语句
2:将sql语句发送到服务器端执行

即效果等同于我们自己将sql语句复制出来手动执行。

2:csv

这种方式需要在服务器端生成文件,而MySQL对于这种在客户端操作并在服务器端生成文件的操作,提供了参数secure_file_priv来控制具体行为,其可能值如下:

1:empty,表示不限制,这种方式很危险,线上不可这样设置
2:一个表示路径的字符串,表示只可以在指定的路径和子路径下生成文件
3:NULL,表示禁止在当前MySQL实例执行select ... into outfile操作,默认就是该配置,是最安全的

为了执行以下的测试,我们需要查看当前secure_file_priv的值,并将其修改为合适的值,以满足测试的要求:

mysql> show variables like 'secure_file_priv';
+------------------+-------+
| Variable_name    | Value |
+------------------+-------+
| secure_file_priv | NULL  |
+------------------+-------+
1 row in set (0.00 sec)

可以看到是NULL,为了测试,我们将其修改为指定路径,方式为修改my.cnf在mysqld下增加secure_file_priv=/tmp,然后重启,重启后如下:

mysql> show variables like 'secure_file_priv';
+------------------+-------+
| Variable_name    | Value |
+------------------+-------+
| secure_file_priv | /tmp/ |
+------------------+-------+
1 row in set (0.00 sec)

下面我们就能开始我们的测试了。

2.1:生成csv文件

[root@localhost etc]# mysql -uroot -p db1 -e "select * from db1.t where a>900 into outfile '/tmp/t.csv'"
Enter password: 
[root@localhost etc]# ll /tmp/ | grep 'csv'
-rw-rw-rw- 1 mysql mysql  1203 Sep 12 17:56 t.csv
[root@localhost etc]# cat /tmp/t.csv 
901     901     901
902     902     902
903     903     903
904     904     904
905     905     905
906     906     906
...

2.2:导入数据

mysql> load data infile '/tmp/t.csv' into table db2.t;
Query OK, 100 rows affected (0.00 sec)
Records: 100  Deleted: 0  Skipped: 0  Warnings: 0

具体的执行流程如下:

1:读入文件,以\t制表符作为字段的分隔符,以\n换行符作为一行的分隔符,读取数据
2:启动事务
3:判断每行的数据个数和字段数是否相同,不相同则直接报错,回滚事务,否则构造一行数据,并调用innodb的接口写入数据
4:重复3,直到csv中的所有行都写入到数据库,最后提交事务

3:物理拷贝

如果只是简单的拷贝.frm和.ibd文件,是不行的,因为这样并没有在系统字典中注册,系统是不会识别的,而在mysql5.6版本中引入了可传输表空间(transportable tablespace)的概念,来解决普通方法不在系统字典中注册等问题,从而实现物理拷贝。接下来看下如何操作:

3.1:创建一张要拷贝数据的表r4,并备份t

mysql> create table r4 like t;
Query OK, 0 rows affected (0.00 sec)

这样就会生成对应的r4.frm,r4,ibd文件了,如下:

[root@localhost db1]# ls -lt
total 632
-rw-r----- 1 mysql mysql 114688 Sep 13 15:59 r4.ibd
-rw-r----- 1 mysql mysql   8604 Sep 13 15:59 r4.frm
...

3.2:r4放弃自己的表空间

mysql> alter table r4 discard tablespace;
Query OK, 0 rows affected (0.00 sec)

这样,会将r4对应的数据文件r4.ibd文件删除。

3.3:生成表t的配置文件

mysql> flush table t for export;
Query OK, 0 rows affected (0.00 sec)

注意:执行完该命令后,表t会整体处于只读状态,效果等同于执行lock tables t read 如下:

mysql> update t set a=a where id=1;
ERROR 1099 (HY000): Table 't' was locked with a READ lock and can't be updated

3.4:使用表t的cfg和ibd生成r4的

[root@localhost db1]# cp t.cfg r4.cfg && cp t.ibd r4.ibd

MySQL用户和创建文件用户可能权限不同,所以需要修改权限:

[root@localhost db1]# chmod 777 r4.cfg && chmod 777 r4.ibd 

3.5:释放表t的表读锁

mysql> unlock tables;
Query OK, 0 rows affected (0.00 sec)

如果是不执行这步的话,表t将一直处于只读状态。

3.6:引入r4的表空间

即使用表t的cfg和ibd生成表r4的相关配置和数据,让MySQL系统识别r4。

mysql> alter table r4 import tablespace;
Query OK, 0 rows affected (0.01 sec)

此时r4就有了和t一样的数据了:

mysql> select count(*) from r4;
+----------+
| count(*) |
+----------+
|     1000 |
+----------+
1 row in set (0.00 sec)

注意:在生产环境执行该操作,最写成脚本,并反复演练,保证没有问题,因为操作数据还是要十分小心的,一旦执行错命令,可能会造成不可逆的严重后果。

写在后面

参考文章列表:

load data locainfile 加载csv文件

05mysql的锁分析

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-09-15 02:04:35  更:2022-09-15 02:04:41 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/23 10:38:25-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码