我们常常会用到数据结构,基础类型的数组和链表,各有千秋。数组:插入时间复杂度高,而查找时间复杂度低,至于链表则恰恰相反。一般情况下,根据查找和插入使用多寡,而来决定那种数据结构。但是,如果给你一段字符串,统计每个字符的出现次数,你会发现那种都有些问题,这种时候我们可以用到hashMap(散列表)。
1.原理:
我们将数组与链表的优势结合起来,在查找存储位置利用数组,而在存储进去时利用链表,达到时间复杂度大大降低的目的。
1.建立链表linkList:
此处的链表其实与我们之前的单向链表几乎一致,但是不同之处在于链表内的属性,内置了hash值,以及其内置了泛型<K,V>(键值)。
public class Node<K,V> implements Map.Entry<K,V> {
final int hash;
final K key;
V value;
Node<K,V> next;
Node(int hash, K key, V value, Node<K,V> next) {
this.hash = hash;
this.key = key;
this.value = value;
this.next = next;
}
hash:散列函数,即通过散列算法变换成固定长度的输出,该输出就是散列值
而特殊之处在于,hash值几乎是唯一,可以作为key的一种int值,而这个对之后作用巨大^_^。
2.建立链表数组linkListArr;
这个不用多多赘述,操作极其简单,但是记得创建数组的时候,将链表初始化。
3.使用方法:
getHash(得到哈希值):? .hashCode()
put(放置):此处就可以体现hashMap的优越性了,由于我们的Key值是任意类型的,因此我们将其通过getHash()方法得到key的hash值,然后将其与链表数组的长度做与运算保证不会超过数组长度
int storeIndex = getHash(key) & len - 1 ;
这样我们就可以轻松得到存储的位置了,但是留下了一个问题,如果我们经过运算后,存储下标一致怎么办呢?
这个时候链表的优越性就体现出来了,可以轻松的加到链表尾,二者利用,使得效率大大提高了。
get(得到):?按照put()中的思路,其实我们也可以简单推导出,利用key算出存储下标,在到对应下表里一个个的寻找。
Java源代码写法:(属于hashMap中最重要的部分,效率最大化):
final Node<K,V> getNode(int hash, Object key) {//查找节点,需要hash 和 key 一起,提高效率
Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
if ((tab = table) != null && (n = tab.length) > 0 &&
(first = tab[(n - 1) & hash]) != null) {//table 为链表数组 得到需要的存储下标
if (first.hash == hash && // 总是想核对头节点
((k = first.key) == key || (key != null && key.equals(k))))//只有在hash值相等情况下,才会去判断key是否相等(先比较地址是否相同,不相同后才比较值),以提高效率(因为hash值相等概率极小,而且比较两个int数据快得多)
return first;
if ((e = first.next) != null) {//安全性检验,查看后面是否右节点
if (first instanceof TreeNode)//由于相同的key值过多,链表显得过于冗长,所以源代码中会将链表变成一棵“树”,方便查找
return ((TreeNode<K,V>)first).getTreeNode(hash, key)//树内查找方式;
do {
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
} while ((e = e.next) != null);//不断循环查找
}
}
return null;
}
|