Java中常见数据结构

一、 8种数据结构

在这里插入图片描述

Java中有8种常见数据结构

哈希表也叫散列表，是一种可以通过关键码值（Key-Value）直接访问的数据结构，可以实现快速查询、插入、删除。

数组类型的数据结构在插入和删除时时间复杂度高；链表类型的数据结构在查询时时间复杂度高；而哈希表结合了数组与链表的优势。

在jdk8中，Java中经典的HashMap，以数组+链表+红黑树构成。

哈希函数在哈希表中起着关键作用，能够将任意长度的输入转为定长的输出（哈希值）。通过哈希函数，能够快速地对数据元素进行定位。

哈希值并不是具有唯一性，在某些情况下Hash值会冲突，HashMap在Hash冲突时，会将元素在数组的位置上添加为链表元素结点，当链表长度大于8时，链表会转换为红黑树。

类比水管，两端放开，一端入水，一端出水。

队列是一种特殊的线性表，它只允许在表的前端进行删除操作，而在表的后端进行插入操作。

树是一种非线性结构，由n(n>0)个有限结点组成有层次关系的集合。

术语：

二叉树：每个结点最多含有2个子树。
完全二叉树：除了最外层的结点，其他各层结点都达到最大数。
满二叉树：
- 国内定义：除最后一层无任何子节点外，每一层上的所有结点都有两个子结点的二叉树。
- 国外定义：如果一棵二叉树的结点要么是叶子结点，要么它有两个子结点，这样的树就是满二叉树。
二叉查找树：
- 任意结点的左子树不为空，左子树所有结点的值均小于根结点的值。
- 任意结点的右子树不为空，右子树所有结点的值均大于根节点的值。
- 任意结点的左右子树也是一颗二叉查找树。
平衡二叉树：也称AVL树，当且仅当任何结点的两棵子树的高度差不大于1的二叉树。Java中HashMap的红黑树就是平衡二叉树！！！
B树：一种对读写优化的自平衡二叉树，在数据库的索引中常见的BTREE就是自平衡二叉树。
B+树：B+树是应文件系统所需而产生的B树的变形树。
- 所有的非终端结点可以看成是索引部分，结点中仅含有其子树根结点中最大（或最小）关键字
- 所有的叶子结点中包含了全部关键字的信息，及指向含有这些关键字记录的指针，且叶子结点本身依关键字的大小自小而大的顺序链接。
- 有m个子树的中间节点包含有m个元素（B树中是k-1个元素），每个元素不保存数据，只用来索引。

实质上就是平衡二叉树，通过颜色约束二叉树的平衡：
1）每个节点都只能是红色或者黑色

2）根节点是黑色

3）每个叶节点（NIL 节点，空节点）是黑色的。

4）如果一个节点是红色的，则它两个子节点都是黑色的。也就是说在一条路径上不能出现相邻的两个红色节点。

5）从任一节点到其每个叶子的所有路径都包含相同数目的黑色节点。

堆可以被看成一个树的数组对象，具有如下特点：

数组是一种线性表的数据结构，连续的空间存储相同类型的数据。

优点：查询速度快。
缺点：数组在创建时大小确定，无法扩容。数组只能存储一种类型的数据。添加、删除元素慢。

栈可以类比为水桶，只有一端能够进出，遵循的先进后出的规则。

栈先进的元素进入栈底，读元素的时候从栈顶取元素。

链表是一种线性表的链式存储方式，链表的内存是不连续的，前一个元素存储地址的下一个地址中存储的不一定是下一个元素。链表通过一个指向下一个元素地址的引用将链表中的元素串起来。

单向链表：单向链表是最简单的链表形式。我们将链表中最基本的数据称为节点(node)，每一个节点包含了数据块和指向下一个节点的指针。
双向链表：顾名思义，双向链表就是有两个方向的链表。同单向链表不同，在双向链表中每一个节点不仅存储指向下一个节点的指针，而且存储指向前一个节点的指针。通过这种方式，能够通过在O(1)时间内通过目的节点直接找到前驱节点，但是同时会增加大量的指针存储空间。
循环链表：循环链表与双向链表相似，不同的地方在于：在链表的尾部增加一个指向头结点的指针，头结点也增加一个指向尾节点的指针，以及第一个节点指向头节点的指针，从而更方便索引链表元素。