IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 数据结构与算法 -> java集合篇 -> 正文阅读

[数据结构与算法]java集合篇

前言

看起来集合跟并发安全似乎关系并不大,可能放在一起是因为课时原因吧。

集合规约

先看看大佬画的类图
在这里插入图片描述

  1. Collection是最顶层接口,并且继承于Iterable,这意味着所有的集合都可以遍历。
  2. Collection有三大子接口:Set、List、Queue。
  3. Map不是Collection。

数据结构

数据结构是指逻辑意义上的数据组织方式,及其相应的处理方式。

数据组织方式

  • 线性结构
    例如:数组、List、Set、Queue(即Collection)

  • 图结构

  • 树结构
    其实树结构是一种特殊的图机构。

  • Hash结构
    例如:Map

    数据处理方式

    以某种特定的算法实现对数据的增加、删除、修改、查找和遍历。

之所以我们很多的初级程序员感受不到对数据的操作处理方式的复杂性,是因为我们通常由数据库来管理我们的数据,即使到应用层,通常也是无脑ArrayList、HashMap。

算法的时间复杂度

对数据的操作是需要付出代价的。例如,关系型数据库经常使用索引数据结构:B+tree,可以实现对数据查找的算法复杂度达到O(logN)。而普通的线性结构要查找一个数据则需要O(N)。可能这样感受还是不直观,来,上图:
在这里插入图片描述
曲线越陡峭,需要操作就越多,对应的需要处理的时间也就更长。

绕不过去的HashMap

数据组织形式

HashMap采用数组+链表/红黑树的形式存储数据。
在这里插入图片描述

  1. 为什么数组取名为table?
    因为数组的每个位置存放的是链表/红黑树,这才有了表的特征:横向、纵向。它还有了另外一个名字:Hash表。
  2. 存放一个元素,首先是根据key在数组中寻找一个位置,通常是取模。例如,数组长度为8,存放元素3,那么就存放到数组下标为3%8=3的位置。但是如果这个位置已经有其他元素了,怎么办呢?这个时候,链表的作用就显现出来了。在链表或者红黑树上增加当前元素就是了。而这种位置上已经有其他元素的情况,我们就成为Hash冲突。链表/红黑树上有多少个元素就意味着发生了多少次冲突。
  3. 取一个元素。这是存放元素的方向过程。在没有hash冲突的情况下,寻找一个元素,只需要取模找到对应位置就行。时间复杂度是O(1)。而当存在hash冲突的时候,链表存储冲突元素时,时间复杂度O(N)。如果是红黑树,时间复杂度就是O(logN)(N为冲突元素个数)。
  4. 当数组容量>=64且同一个槽冲突元素个数超过8个时,该槽位的冲突元素将从链表组织形式改为红黑树。
    在这里插入图片描述

HashMap是什么时候分配空间的

除了public HashMap(Map<? extends K, ? extends V> m) { this.loadFactor = DEFAULT_LOAD_FACTOR; putMapEntries(m, false); }构造器外,不管是默认的无参构造器还是其他构造器,都没有分配table数组空间。那么,他是在什么时候分配空间的呢?在第一次put的时候,在判断table为空后,会调用resize方法申请空间。
在这里插入图片描述
第一个条件分支,对应的是传入了初始容量的构造参数:
在这里插入图片描述
而第二个条件分支,对应的是无参构造器
在这里插入图片描述
小结:
无参构造器不会计算数组容量,需要在resize中使用默认值。
传了初始容量的构造器,会先计算数组容量,并且用阈值threshold暂时存放。在resize时,将阈值作为容量来创建数组。

为什么要用阈值字段来存储?因为HashMap没有字段存储容量,只有存储阈值。实际上容量和阈值是可以通过负载因子来互相转换的。鉴于在判断扩容时,只需要跟阈值做比较,因此选择存储阈值,而计算容量是很划算的。

申请多大的空间

在这里插入图片描述
相信大家都了解到HashMap会把初始容量向上取整为第一个大于该容量的2^n。但他是如何做到的?
先看下java.lang.Integer#numberOfLeadingZeros这是个很神奇的方法。多亏了规范的方法命名,我得以了解到这个方法是计算数字的前面有多少个0。什么意思呢?就是在二进制表示中,这个数字的前面有多少位是为0的。例如:整数1,那么前面就有31个0.因为整数一共32位。现在你知道这个方法是干嘛的了,等会儿再回来看它是怎么做到的。
-1 在二进制中表示为32个1,对应的是-1的补码
因此第一行语句就是把当前容量的有用的位数全部转换为1,例如:只要大于8【2的3次幂】但小于等于16【2的4次幂】的值,全部转换为15【1111】。以9为例,1001。-1无符号右移(32-4)=28位之后,就是15了。这样,只要再+1,就得到16,也就是2^n。

再来看看java.lang.Integer#numberOfLeadingZeros

在这里插入图片描述
怎么计算二进制表示中有多少个前导零呢?可以看到还是位移操作,虽然比较难理解,但是还是要理解啊。
经过一番向度娘的讨教,我找到了大佬的文章
核心思想是,把当前问题进行转换,转换为,寻找第一个不为0的位。然后再移位。而整数有32位,通过二分法来加速。如果你们有看大佬的文章,就会发现源码跟我上面贴的不太一样。n=-1,我贴出来的是n=31。我猜测,因为我用的JDK版本更高,因为效率更高。最后的移位只需要移动1次,而老版本移动的是31次。不得不说,Java这波操作已经超出了我的想象,连这点性能都要优化到极致!

晚安了各位。

  数据结构与算法 最新文章
【力扣106】 从中序与后续遍历序列构造二叉
leetcode 322 零钱兑换
哈希的应用:海量数据处理
动态规划|最短Hamilton路径
华为机试_HJ41 称砝码【中等】【menset】【
【C与数据结构】——寒假提高每日练习Day1
基础算法——堆排序
2023王道数据结构线性表--单链表课后习题部
LeetCode 之 反转链表的一部分
【题解】lintcode必刷50题<有效的括号序列
上一篇文章      下一篇文章      查看所有文章
加:2021-11-14 21:58:23  更:2021-11-14 21:59:19 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/9 1:03:41-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码