开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 大数据 -> 数据库索引和MySQL优化 -> 正文阅读

[大数据]数据库索引和MySQL优化

一、索引

1.什么是索引

索引是对数据库表中一列或多列的值进行排序的一种结构，使用索引可快速访问数据库表中的特定信息。简而言之，数据库索引是排好序的数据结构，为了提高数据的查询效率。

在数据库中，索引也允许数据库程序迅速地找到表中的数据，而不必扫描整个数据库。

MySQL常用的索引就是B+树。

2.索引的分类

索引分为聚簇索引和非聚簇索引两种。

聚簇索引是按照数据存放的物理位置为顺序的，能提高多行检索的速度。
注意：一个表中只能有一个聚集索引。

非聚簇索引不对数据进?物理排序，对于单行的检索很快。
注意：一个表中可以有多个非聚集索引。

单值索引（最通用、最简单）：一个索引只包含单个列，一个表中可以有多个单值索引

唯一索引：索引列的值必须唯一，可为空

复合索引(又叫联合索引，功能最强大)：一个索引包括多个列

3.索引的优势

1）提高数据检索效率，降低磁盘IO成本
2）通过对数据的排序，降低排序成本

4. 索引的劣势

1）索引虽提高了查询效率，但同时降低了更新、修改、删除的效率，因为MySQL不仅要保存数据，还要维护数据和索引的关系。

2）需要成本去维护索引。一个性能良好的索引需要不断的去尝试，以找到最优解。

5. 什么情况下适合建立索引

1）主键自动建立唯一索引
2）频繁作为查询条件的字段（where后面的字段）
3）查询中与其他表关联的字段（各种join on后面的字段）
4）单值/复合索引选择？（高并发下倾向选择复合索引）
5）查询中排序的字段
6）查询中统计或分组的字段

6. 什么情况下不适合建立索引

1）表数据太少
2）频繁更新的字段
3）where后面用不到的字段

7. 什么时候会出现索引失效

1）like以通配符开头(‘%abc’)会导致索引失效，违反最左前缀法则
最左前缀法则：最左优先，以最左边的为起点任何连续的索引都能匹配上。同时遇到范围查询(>、<、between、like)就会停止匹配。

2）在索引列上做任何操作(计算、函数、类型转换)，会导致索引失效而转向全表扫描

3）存储引擎不能使用索引中范围条件右边的列，举例：select id，name from student where id > 50 and name = ‘张三’，会导致name索引失效

4）尽量使用覆盖索引，不要select *

5）MySQL在使用不等于(!=或<>)的时候无法使用索引会导致全表扫描，理由也很简单，B+Tree叶子节点用指针相连且是排好序的，这种数据结构只能解决有序的定值查询，像不等于这种无法利用索引查询。

6）IS NULL、IS NOT NULL无法使用索引，理由同上

7）字符串不加单引号索引失效
? 隐式转换–>函数操作

8）用or连接时会导致索引失效

8. 为什么建议InnoDB必须建主键

因为这样能降低数据库开销，对于InnoDB来说，如果不手动建主键索引，MySQL底层依然会帮我们创建一个聚集索引来维护整张表的所有数据，因为B+Tree必须依靠索引才能建立。

9. 为什么推荐使用整型主键

因为比较两个int型更具有优势，字符串需要逐位的去比较。

10. 为什么推荐使用自增主键

因为如果主键已经插入了1、2、3、4、6、7，这时候我们插入了5，MySQL在维护索引的时候就会打破原有链表顺序，导致链表节点分裂重排，从而消耗性能。而使用自增主键就不会产生这种问题。

11. 为什么InnoDB非主键索引存储的是主键值

保持一致性，当数据库表进行DML操作时，同一行记录的页地址会发生改变，因非主键索引保存的是主键的值，无需进行更改。同时还可以节省存储空间，因为Innodb数据本身就已经汇聚到主键索引所在的B+树上了，如果普通索引还继续再保存一份数据，就会导致有多少索引就要存多少份数据。

二、MySQL优化

1、选择最合适的字段属性
2、尽量把字段设置为NOT NULL
3、使用连接（JOIN）来代替子查询（Sub-Queries）
4、使用联合（UNION）来代替手动创建的临时表
5、使用事务
6、使用外键
7、锁定表
8、使用索引
9、优化查询语句

9.1 不使用子查询
9.2 避免函数索引
9.3 用IN来替换OR
9.4 LIKE双百分号无法使用到索引
9.5 读取适当的记录LIMIT M,N
9.6 避免数据类型不一致
9.7 分组统计可以禁止排序
9.8 避免随机取记录
9.9 禁止不必要的ORDER BY排序
9.10 批量INSERT插入

大数据最新文章

实现Kafka至少消费一次

亚马逊云科技：还在苦于ETL？Zero ETL的时代

初探MapReduce

【SpringBoot框架篇】32.基于注解+redis实现

Elasticsearch：如何减少 Elasticsearch 集

Go redis操作

Redis面试题

专题五 Redis高并发场景

基于GBase8s和Calcite的多数据源查询

Redis——底层数据结构原理

加:2022-08-19 19:12:48 更:2022-08-19 19:14:05

360图书馆购物三丰科技阅读网日历万年历 2026年4日历

-2026/4/28 23:41:41-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码