IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> MyBatis-Plus的saveBatch批量插入为何效率很低耗时长详解及解决方案 -> 正文阅读

[大数据]MyBatis-Plus的saveBatch批量插入为何效率很低耗时长详解及解决方案

MySQL数据库

针对MySQL数据库saveBatch批量插入效率比较低,是比较好解决的,一般都是由于数据库连接url上没有配置批量操作的属性,只需要在url上加上如下属性即可:

rewriteBatchedStatements=true

即类似如下:

jdbc:mysql://数据库地址/数据库名?useUnicode=true&characterEncoding=UTF8&allowMultiQueries=true&rewriteBatchedStatements=true

加上之后,你就会发现,saveBatch的速度直线提升,效果还是很不错的,一万条数据估计也就在几百毫秒。

Oracle数据库

Oracle数据库的问题就比较大了,而且至今潘老师也没找到一个比较完美的解决方案,此次写这篇博客也正是由于Oracle数据库saveBatch效率贼低引起的,先看下图,批量插入一万条数据(MyBatis-Plus的saveBatch默认一次1000条,1w条会分10次,当然你也可以设置Batch Size),耗时竟然达到10s多,简直不能忍啊,堪比龟速!

在这里插入图片描述
于是就开始各种排查,经过一番仔细debug、翻源码,反复测试对比验证,最终发现是因为MyBatis-Plus的针对Oracle主键序列生成策略导致的,在上图打印的日志可以看出,在每次打印参数之前,都会先执行下SELECT XXX.NEXTVAL FROM DUAL,这是我们在实体Entity上加上了MyBatis-Plus的注解@KeySequence(value = “XXX”)引起的,本来预想的1万条只需要和数据库交互10次就解决了,现在看打印日志情况,预估是insert和查询序列合计预计2万次交互,于是,测试了下去掉@KeySequence注解,手工给id赋好值,再次批量保存1万条,结果如下:
在这里插入图片描述
好家伙,直接干到1s多点,整整节约了10倍的时间,病根终于确定了,就是@KeySequence注解导致的。

但你这就想把锅甩给MyBatis-Plus那就大错特错了,这锅归根到底其实还是MyBatis的,为什么呢?经过潘老师一番深入探查,发现正如MyBatis-Plus官方所说,只对MyBatis做扩展却不改变,做一对快乐的好基友,@KeySequence(value = “XXX”)作用就是结合KeyGenerator来实现自动化生成主键并回填,但是MyBatis-Plus的所有KeyGenerator也是从MyBatis继承扩展而来,而使用了之后,对于Oracle而言就相当于在insert语句前加上了selectKey语句,类似如下:

<selectKey keyColumn="id" keyProperty="id" resultType="int" order="BEFORE">
       select XXX.nextval from dual
</selectKey>

这是不是很熟悉,就是我们学MyBatis时候学的啊,MyBatis-Plus只不过是把它变成了@KeySequence注解,省去了你写这段xml了而已,而所有问题的源头就来自于这段xml,潘老师亲自测试,在insert前加上这段xml后使用Mybatis原生的SqlSession sqlSession = sqlSessionTemplate.getSqlSessionFactory().openSession(ExecutorType.BATCH)批量插入,发现批量插入无效,耗时和MyBatis-plus差不多,1w条大概10多秒,但是一旦去掉这段xml,再使用原生的Batch插入,我的天,竟然只要500多毫秒,也就是0.5秒,这差距在20倍左右,一直以为是MyBatis-Plus的锅,原来是MyBatis的锅,这下舒服了,可以安心地用MyBatis-Plus了,除非你不用mybatis了~
在这里插入图片描述

解决方案

后期补充:最优解:

今天经过潘老师继续翻看源码,还真让潘老师发现了一个新的非常好的解决方案,原来我们的xml中sql都是由MyBatis-Plus动态帮我们生成的,包括id为insert的,经过测试发现,如果我们在xml中自己再新定义一个id为insert的sql语句(注意id必须为insert),就将原来的默认生成的覆盖掉了,直接使用我们自己定义的,那么问题就迎刃而解了,具体如下:
a)去掉KeyGenerator实体对象的配置
b)去掉@KeySequence注解
c)id-type: 设置为AUTO
d)在实体对应的xml新增id为insert的sql,类似如下:

<insert id="insert" parameterType="user">
        insert into t_user(id, username, password)
        values(SEQ_USER.NEXTVAL,#{username},#{password})
</insert>

e)继续调用MyBatis-Plus的saveBatch或save,都会走我们写的这个insert对应的xml
f)测试后1w条大概在几百毫秒。

原可选方案:
1)其中一种比较理想的解决方案是使用触发器来解决,抛弃@KeySequence注解,在插入数据Entity时,由触发器生成序列给id赋值,缺点是无法将id返回到实体,况且我们项目组要求不允许使用触发器,因此就放弃了这种方案。
2)网上还有一种方案就是使用begin end包裹所有sql,不过经过亲测,发现比使用MyBatis-Plus主键生成策略还坑,时间直接再翻10倍,直接忽略吧,因为它底层根本不是Batch,而且我还试了一次10w条,直接就挂了(抛异常,提示变量太多),1W条耗时120多秒,比龟速还龟速!
以下是网上方案(大批量数据强烈不建议使用):
存储过程不是写死在数据库中,而是在Mapper.xml中,使用begin end包裹foreach批量生成insert语句作为一个整体提交给Oracle,id由序列在数据库直接生成,类似如下(注意两个地方的分号不能少):

<insert id="insertBatch" parameterType="java.util.List">
        begin
        <foreach collection="list" item="user">
            insert into t_user(id, username, password)
            values(SEQ_USER.NEXTVAL,#{user.username},#{user.password});
        </foreach>
        end;
    </insert>

注意:这种方案在写插入SQL如果想通用性比较好的话,需要针对部分有默认值的字段特别处理,因为你提交的是Entity集合,如果这些字段存在为null的也会作为null插入,而不会使用默认值,这是因为insert语句是全字段声明式插入,所以即使某个字段为空,它也不会使用数据库中的默认值,因此解决方案一种是有默认值字段的不在insert语句中声明,不过这样通用性不好,另外一种就是对其进行动态判断

3)第三种方案就是不使用数据库序列生成主键,我们自己使用java代码写个主键生成策略(类似UUID这种),这样就避免了和数据库的频繁交互,我觉得这种方案也比较靠谱。

4)还有一种和第2种类似,不过是使用UNION ALL来联合插入的,避免了begin end,但是据说只能UNION ALL2000条,多了就会出问题。

5)最后一种,回归本源,使用原生的MyBatis的SqlSession中使用Batch模式吧,别使用selectKey就行

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-07-17 16:30:00  更:2022-07-17 16:33:54 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/16 1:43:02-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码