IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> mysql分页和连表索引及字段类型实战 -> 正文阅读

[大数据]mysql分页和连表索引及字段类型实战

分页查询:

CREATE TABLE `tb_user` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT,
  `username` varchar(50) NOT NULL COMMENT '用户名',
  `password` varchar(32) NOT NULL COMMENT '密码,加密存储',
  `phone` varchar(20) DEFAULT NULL COMMENT '注册手机号',
  `email` varchar(50) DEFAULT NULL COMMENT '注册邮箱',
  `created` datetime NOT NULL,
  `updated` datetime NOT NULL,
  PRIMARY KEY (`id`),
  KEY `name_phone_email` (`username`,`phone`,`email`)
) ENGINE=InnoDB AUTO_INCREMENT=102538 DEFAULT CHARSET=utf8 COMMENT='用户表';

  SELECT * from  tb_user  ORDER BY username LIMIT 90000,10;

根据username 排序排序后取出取出90001行开始的10条记录,实际是先取出90010条记录,抛弃前面的90000条数据,只保留后面的10条数据返给前端。因此查询一张大表时,获取越靠后的数据,查询效率越低。
在这里插入图片描述
没有走索引,前面的文档说过,可能优化器觉得通过索引找到符合条件的主键,再利用主键到主键索引中找数据,比直接扫描主键索引的成本还要高;但是使用覆盖索引,绝大情况下会走索引的。

Join关联查询优化:

Mysql表关联常用的两种算法:

  • Nested-Loop Join算法
  • Block Nested-Loop Join算法

1、嵌套循环连接Nested-Loop Join(NLJ)算法
一般索引字段关联的使用此算法
一次一行的从驱动表中取出数据行,用这行数据的关联字段查询被驱动表的满足条件的数据,然后合并表的结果集。
在这里插入图片描述
图中user表只有两条数据,tb_user有十万条数据;从执行计划中可以看出user表是驱动表,优化器一般会选择小表作为驱动表;
当使用left join时,指定了左表是驱动表;但使用right join时,指定了右表是驱动表;当使用inner join时,使用小表做为驱动表。
一般join语句,执行计划中Extra中未出现using join buffer则表示使用的join算法是NLJ算法。
上面sql的执行流程如下:
1、取出user表中满足条件的一行数据
2、从上步取出关联的字段id到tb_user中查找
3、取出tb_user表中满足条件的数据,跟user表中取出的数据合并;放在结果集中
4、重复上面的步骤,直到user表取不到数据为止,最后把结果集中的数据返给客户端。

2、基于块的嵌套循环连接Block Nested-Loop Join(BNJ)算法
如果被驱动表关联字段不是索引,则会使用此算法
把驱动表的数据读到join buffer中,然后把被驱动表中的数据一行行取出来和join buffer中的数据做对比,保留符合条件的数据到结果集中。
在这里插入图片描述
上面sql执行的大致流程如下:
1、先从user表中取出所有满足条件的数据到join buffer中
2、把tb_user表中的每一行取出来和join buffer中的数据做对比
3、把对比满足条件的数据放在结果集中
4、返回结果集给前端。

对于关联sql的优化:
1、被驱动表的关联字段尽量使用索引,让使用NLJ算法
2、小表驱动大表:确定哪张表是小表,可以用straight_join来指定左边的表作为驱动表,省去mysql优化器判断的时间。

in和exsits优化:

小表驱动大表的优化原则,即小的数据集驱动大的数据集
in:当B表的数据集小于A表时,in优于exsits

select * from A where id in (select id from B);

等价于:
for(select id from B ){
select * from A where A.id=B.id;
}

exsits:当B表的数据大于A表时,exsits优于in

select * from A where exsits (select 1 from B where B.id=A.id );

等价于:
for(select id from A){
select * from B where B.id=A.id;
}

1、exists(条件) 只返回true和false,因此select *和select 1没有区别,官方说会忽略查询字段;
2、exists子语句查询可以使用join查询来代替,需要根据具体情况来优化

补充:MySQL数据类型选择

在MySQL中,选择正确的数据类型,对于性能至关重要。一般应该遵循下面两步:
(1)确定合适的大类型:数字、字符串、时间、二进制;
(2)确定具体的类型:有无符号、取值范围、变长定长等。
在MySQL数据类型设置方面,尽量用更小的数据类型,因为它们通常有更好的性能,花费更少的硬件资源。并且,尽量
把字段定义为NOT NULL,避免使用NULL。

1、数值类型
在这里插入图片描述
优化建议

  1. 如果整形数据没有负数,如ID号,建议指定为UNSIGNED无符号类型,容量可以扩大一倍。
  2. 建议使用TINYINT代替ENUM、BITENUM、SET。
  3. 避免使用整数的显示宽度(参看文档最后),也就是说,不要用INT(10)类似的方法指定字段显示宽度,直接用 INT。
  4. DECIMAL最适合保存准确度要求高,而且用于计算的数据,比如价格。但是在使用DECIMAL类型的时候,注意 长度设置。
  5. 建议使用整形类型来运算和存储实数,方法是,实数乘以相应的倍数后再操作。
  6. 整数通常是最佳的数据类型,因为它速度快,并且能使用AUTO_INCREMENT。

2、日期和时间
在这里插入图片描述
优化建议

  1. MySQL能存储的最小时间粒度为秒。
  2. 建议用DATE数据类型来保存日期。MySQL中默认的日期格式是yyyy-mm-dd。
  3. 用MySQL的推荐类型DATE、TIME、DATETIME来存储时间,而不是使用字符串。
  4. 当数据格式为TIMESTAMP和DATETIME时,可以用CURRENT_TIMESTAMP作为默认(MySQL5.6以后),
    MySQL会自动返回记录插入的确切时间。
  5. TIMESTAMP是UTC时间戳,与时区相关。
  6. DATETIME的存储格式是一个YYYYMMDD HH:MM:SS的整数,与时区无关,你存了什么,读出来就是什么。
  7. 除非有特殊需求,一般的公司建议使用TIMESTAMP,它比DATETIME更节约空间,但是像阿里这样的公司一般会用DATETIME,因为不用考虑TIMESTAMP将来的时间上限问题。
  8. 有时人们把Unix的时间戳保存为整数值,但是这通常没有任何好处,这种格式处理起来不太方便,我们并不推荐它。

3、字符串
在这里插入图片描述
优化建议

  1. 字符串的长度相差较大用VARCHAR;字符串短,且所有值都接近一个长度用CHAR。
  2. CHAR和VARCHAR适用于包括人名、邮政编码、电话号码和不超过255个字符长度的任意字母数字组合。那些要用来计算的数字不要用VARCHAR类型保存,因为可能会导致一些与计算相关的问题。换句话说,可能影响到计算的准确性和完整性。
  3. 尽量少用BLOB和TEXT,如果实在要用可以考虑将BLOB和TEXT字段单独存一张表,用id关联。
  4. BLOB系列存储二进制字符串,与字符集无关。TEXT系列存储非二进制字符串,与字符集相关。
  5. BLOB和TEXT都不能有默认值。

INT显示宽度
我们经常会使用命令来创建数据表,而且同时会指定一个长度,如下。但是,这里的长度并非是TINYINT类型存储的最大长度,而是显示的最大长度。
CREATE TABLE user(
id TINYINT(2) UNSIGNED
);
这里表示user表的id字段的类型是TINYINT,可以存储的最大数值是255。所以,在存储数据时,如果存入值小于等于 255,如200,虽然超过2位,但是没有超出TINYINT类型长度,所以可以正常保存;如果存入值大于255,如500,那么 MySQL会自动保存为TINYINT类型的最大值255。
在查询数据时,不管查询结果为何值,都按实际输出。这里TINYINT(2)中2的作用就是,当需要在查询结果前填充0时,
命令中加上ZEROFILL就可以实现,如:
id TINYINT(2) UNSIGNED ZEROFILL
这样,查询结果如果是5,那输出就是05。如果指定TINYINT(5),那输出就是00005,其实实际存储的值还是5,而且存储的数据不会超过255,只是MySQL输出数据时在前面填充了0。
换句话说,在MySQL命令中,字段的类型长度TINYINT(2)、INT(11)不会影响数据的插入,只会在使用ZEROFILL时有用,让查询结果前填充0。

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-06-25 18:11:43  更:2022-06-25 18:13:28 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/19 23:19:51-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码