底层数据结构1.7和1.8有何不同?
1.7:数组 + 链表;1.8数组 +(链表 | 红黑树)
为何要用红黑树?为何一上来不树化?树化阈值为何是8 ?何时会树化?何时会退化为链表?
问题一:避免链表或数组过长时影响HashMap的性能 问题二:这是因为红黑树相对于链表维护成本大,TreeNode占比空间比普通的Node大,红黑树在插入新数据之后,可能会通过左旋、右旋、变色来保持平衡,造成维护成本过高 问题三:在hash值足够随机的情况下,链表长度超过8的概率是非常小的,目的就是为了使树化的几率足够小 问题四:数组长度大于64的同时 链表长度大于8 问题五:①扩容时 可能会进行树的拆分,当树的元素个数 <= 6 时就会退化为链表 ②:remove树节点 之前检查树,若root、root.left、root.right、root.left.left有一个为null时,也会退化为链表
链表过长解决:扩容 或树化
扩容 :①当元素个数大于原始容量的0.75倍(负载因子) 时,现容量扩大为原始容量的2倍 ②链表长度大于8且数组长度小于64 扩容是先添加元素再进行扩容
树化 :数组长度大于64的同时 链表长度大于8
注 :未树化时,链表长度是可以大于8的
索引如何计算?hashCode都有了,为何还要提供hash()方法?数组容量为何是2的n次幂?
问题一:计算对象的hashCode(),再进行调用HashMap的hash()方法进行二次哈希,最后&(capacity-1) 得到索引 问题二:二次哈希是为了综合高位数据,让哈希分布更为均匀,一定程度上防止了链表过长 问题三:①计算索引时,如果是2的次幂可以使用位与运算代替取模,效率更高 ; ②扩容时hash(二次哈希值)&oldCap==0 的元素留在原来位置,否则新位置=旧位置+oldCap
put()方法流程,1.7和1.8的区别?
区别 ①链表插入节点时,1.7是头插法,1.8是尾插法 ②1.7是大于阈值且没有空位(指要插入的节点索引位置本来就没有元素) 时才扩容,而1.8是大于阈值就扩容 ③1.8在扩容计算Node索引时,会优化
①HashMap是惰性创建数组的,首次使用也就是首次调用put方法时,才会创建数组 ②计算索引(桶下标) ③如果桶下标还没人占用,创建Node占位返回 ④如果桶下标已有人占用 ④.1已经是TreeNode走红黑树的添加或更新逻辑 ④.2是普通Node,走链表的添加或更新逻辑,如果链表长度超过树化阈值,走树化逻辑 ⑤返回前检查容量是否超过阈值,一旦超过进行扩容
加载因子为何默认为0.75
①是为了取得较好的权衡 ②大于这个值,空间节省了,但是链表长度过长就会影响性能 ③小于这个值,冲突减少了,但扩容会更加频繁,空间占用较多
多线程下会有啥问题
1 扩容死链
1.7
2 数据错乱
1.7、1.8
key能否为null,作为key的对象有什么要求
①HashMap的key可以为null,但Map的其他实现类不一定 ②作为key的对象,必须实现hashCode和equals方法,并且key的内容不能修改(不可变),因为修改之后对象的hashCode会发生改变,就找不到原来的对象
String对象的hashCode()如何设计的,为啥每次都是乘31
目标是达到较为均匀的散列效果,每个字符串的hashCode足够独特
|