IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 连接查询-mysql详解(五) -> 正文阅读

[大数据]连接查询-mysql详解(五)

上篇文章说了,mysql5.6.6版本之前数据默认在系统表空间,之后默认在独立表空间,innodb因为索引和数据在一个b+树,所以两个文件,一个文件结构,一个存数据,myISAM则是三个文件。一个聚簇索引有两个段,叶子段和非叶子段,一个段有他专属的区,数据刚开始存在碎片区,不属于任何段,直属表空间。

系统表空间-mysql详解(四)https://blog.csdn.net/ke1ying/article/details/126861965

Mysql访问方法

Access method的概念主要通过两种方法获取数据,第一种是全表扫描获取,第二种是通过索引获取,至于采用什么方式访问代价更低,这是mysql优化器该做的事。

Const:当我们采用主键或者唯一键的时候,速度则是最高效的,但这是建立在查询条件没查询null的情况下,如果是查询null,因为就不是唯一,会查询到多条数据,这时候效率则是ref_null。

Ref:当我们用普通索引等值查询时候,这时候效率则是ref,他的经过是先查询二级索引b+树,再回表查询主表,这就意味着回表的数据越多,效率则越低,所以取决于二次查询的数据量,太多不会采用ref,当然,查询的前提也是没有null的情况。

Ref_or_null:当我们用索引列查询null的时候,效率就没有上面的高,于是就是当前等级。

Range:前面介绍都是等值查询,当前这个是范围查询,

Index:当我们查询的条件没有符合最左索引,但是查询的列都包含复合索引,结果查询条件是从第二列开始,这时候他不会走复合索引,但是他会遍历复合索引。

All:这就是直接全表扫描。

当有两个二级索引出现的时候,一般只会用一个二级索引来查询,比如a、b两个二级索引,mysql优化器,会看哪个索引查询的数据更少,再用更少的数据来回表查询聚簇索引真实数据,查到真实数据后在过滤其他条件。

联合索引,前面刚说了当两个二级索引出现的时候,只会有一个二级索引查询,这也不是百分百的,1、如果两个二级索引都是精确查找,没有区间查找,这时候也是会触发两个二级索引查询。2、当主键id区间查找,也会触发两个索引查询。

因为单独索引mysql优化器内部会有union或和intersection且的消耗,当时使用两个索引的时候,于是联合索引肯定是更优 的选择,在时间和空间都得到提升。

连接查询

当我们连接查询的时候,就有了驱动表的概念,mysql优化器会选择代价更小的作为驱动表,也就是第一个需要查询的表,而另一个表就是被驱动表,被驱动表查询的次数取决于驱动表查询数据的多少,驱动表查询一次,查询出来的数据,再多次查询被驱动表,多少条数据则查询多少次。

连接查询分为内连接和外连接,当查询的需求是驱动表有数据,而被驱动表没有数据,这时候则需要考虑用外连接,外连接则由on关键字需要使用,表示需要查询的结果即使没有查询到,也需要放入到结果集,而where查询的过滤条件不会放入结果集。Left join则是以左边表为驱动表,right join则是右边表为驱动表。

内连接和外连接最大的区别就是on后面的过滤条件,会不会在结果集返回,内连接的on可以直接理解为where。

Nested_loop join:前面说了,驱动表查询的时候,只会访问一次,然后通过结果集查询被驱动表,这时候被驱动表会查询多次,那如果三个表四个表进行查询呢,就需要再次重复第二步操作,用结果集再次查询第三张表,依次嵌套查询下去,这个过程就像是嵌套循环,所以连接查询超过三次则会非常影响效率。

虽然被驱动表是需要查询多次的,但是也是可以走索引查询,因为mysql优化器会把sql优化成单表查询,然后走索引,当表1的a字段和表2的b字段相等的情况下,直接把驱动表表1确定常数,然后把值带入b字段单表查询表2,从而可以走索引。

Join buffer:扫描表的过程是先把磁盘上的数据刷新到内存上,然后在处理join,但实际场景中查询数据太大,这时候后面的数据磁盘io的情况下,前面的数据就需要释放。于是joinbuffer就出来了,这个参数可以用join buffer size来设置大小,他会把驱动表的结果集放入这个内存中,当然更好的效果还是在被驱动表的查询条件上加上索引,这样查询效率更高。

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-09-21 00:35:41  更:2022-09-21 00:38:12 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/15 20:51:21-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码