1. 直接定制法

取关键字的某个线性函数为散列地址：hash(key) = A*key + B

优点：简单，均匀

缺点：需要事先直到关键字的分布情况

使用场景：适合查找比较小且连续的情况

2. 除留余数法（常用）

设哈希表中允许的地址数为m，取一个不大于m，但最接近或者等于m的质数p作为除数，按照哈希函数：hash(key) = key%p(p<=m),将关键码转换成哈希地址

3. 平方取中法（了解）

假设关键字为1234，对它平方就是1522756，抽取中间的3位227作为哈希地址；再比如关键字为4321，对它平方就是18671041，抽取中间的3位671(或710)作为哈希地址

平方取中法比较适合：不知道关键字的分布，而位数又不是很大的情况

4. 折叠法（了解）

折叠法是将关键字从左到右分割成位数相等的几部分(最后一部分位数可以短些)，然后将这几部分叠加求和，并按散列表表长，取后几位作为散列地址。

折叠法适合事先不需要知道关键字的分布，适合关键字位数比较多的情况

5. 随机数法（了解）

选择一个随机函数，取关键字的随机函数值为它的哈希地址，即H(key) = random(key),其中random为随机数函数。

通常应用于关键字长度不等时采用此法

6. 数学分析法（了解）

设有n个d位数，每一位可能有r种不同的符号，这r种不同的符号在各位上出现的频率不一定相同，可能在某些位上分布比较均匀，每种符号出现的机会均等，在某些位上分布不均匀只有某几种符号经常出现。可根据散列表的大小，选择其中各种符号分布均匀的若干位作为散列地址。

2.4 冲突-避免-负载因子的调节

哈希表载荷因子定义为：α = 填入表中元素的个数 / 哈希表的长度

α是散列表装满程度的标志因子，由于表长是定值，α与“填入表中元素个数”成正比，所以α越大，表明填入表中的元素越多，产生冲突的可能性就越大；反之，α越小，表明填入表中的元素就越少，产生哈希冲突的可能性就越小。

负载因子和冲突率的关系粗略演示：

所以当冲突率达到一个无法忍受的程度时，我们需要通过降低负载因子来变相的降低冲突率。

已知哈希表中已有的关键字个数是不可变的，那我们能调整的就只有哈希表中的数组的大小。?

3. 哈希冲突的解决方式

解决哈希冲突的两种常用方式：闭散列和开散列?

3.1 闭散列

闭散列：也叫开放定址法，当发生哈希冲突时，如果哈希表未被装满，说明哈希表中还有空余位置，那么可以将key存放到冲突位置的下一个空位置?

空位置的探测方法：
1. 线性探测：

比如上面的场景，现在需要插入元素44，先通过哈希函数计算哈希地址，下标为4，因此44理论上应该插在该位置，但是该位置已经放了值为4的元素，即发生哈希冲突。

线性探测：从发生冲突的位置开始，依次向后探测，直到寻找到下一个空位置为止，如果后面没有空位置，则重新开始从头继续找

插入：

· 通过哈希函数获取待插入元素在哈希表中的位置

· 如果该位置没有元素则直接插入新元素，如果该位置有元素则发生哈希冲突，使用线性探测找到下一个空位置，插入新元素

注意：采用闭散列处理哈希冲突时，不能随便物理删除哈希表中已有的元素，若直接删除元素会影响其他元素的搜索。比如删除元素4，如果直接删除掉，44查找起来可能会受影响。因此线性探测采用标记的伪删除法来删除一个元素

优点：处理方式简单

缺点：容易产生数据堆积

2. 二次探测

线性探测的缺陷是产生冲突的数据堆积在一块，这与其找下一个空位置有关系，因为找空位置的方式就是挨着往后逐个去找，因此二次探测为了避免该问题，找下一个空位置的方法为：index += i^2,index为对元素的关键码key通过哈希函数计算得到的位置，这里i = 1，2，3......如果index大于容量，那么index %= 容量。对于上述如果要插入44情况进行说明：

研究表明：当表的长度为质数且表装载因子a不超过0.5时，新的表项一定能够插入，而且任何一个位置都不会被探查两次。因此只要表中有一半的空位置，就不会存在表满的问题。在搜索时可以不考虑表装满的情况，但在插入时必须确保表的装载因子a不超过0.5，如果超出必须考虑扩容。

优点：解决了线性探测的数据堆积

缺点：元素数量在上升，找空位置的次数在上升，导致找空位置的效率大大降低?

3.2 闭散列（哈希桶）---重点掌握

开散列法又叫链地址法(开链法)，首先对关键码集合用散列函数计算散列地址，具有相同地址的关键码归于同一子集合，每一个子集合称为一个桶，各个桶中的元素通过一个单链表链接起来，各链表的头结点存储在哈希表中。

从图中可以看出：开散列每个桶中放的都是发生哈希冲突的元素

开散列，可以认为是把一个在大集合中的搜索问题转化为小集合中的搜索问题

4. 实现哈希桶（代码+注释）

实现的主要方法就是单链表的知识，具体看如下参考代码：

public class HashBucket {
    //定义内部类构造单链表
    public static class ListNode {
        Integer key;
        Integer val;
        ListNode next;

        public ListNode(Integer key, Integer val) {
            this.key = key;
            this.val = val;
        }
    }

    ListNode[] table;   //定义一个存储链表结点类型的数组
    int size;  //哈希桶数

    //哈希桶的构造方法,带有初始容量的参数
    public HashBucket(int initCapacity) {
        initCapacity = initCapacity <= 0 ? 16 : initCapacity;
        table = new ListNode[initCapacity];
    }

    //哈希函数
    private int hashFunc(int key) {
        return key % table.length;  //除留余数法
    }

    //插入元素
    public Integer put(Integer key, Integer val) {
        int bucketNo = hashFunc(key);    //计算桶的位置
        ListNode cur = table[bucketNo];
        while (cur != null) {
            if (key.equals(cur.key)) {    //如果key相同，更新val
                Integer oldVal = cur.val;
                cur.val = val;
                return oldVal;
            }
            cur = cur.next;
        }
        ListNode newNode = new ListNode(key, val);
        newNode.next = table[bucketNo];     //头插，插在链表头部，头插效率高
        table[bucketNo] = newNode;
        size++;
        return val;
    }

    //搜索
    public Integer get(Integer key) {
        int bucketNo = hashFunc(key);     //计算桶的位置
        ListNode cur = table[bucketNo];
        while (cur != null) {
            if (key.equals(cur.key)) {
                return cur.val;
            }
            cur = cur.next;
        }
        return null;
    }

    //获得key对应的值，如果无key返回val
    public Integer getOrDefault(Integer key, Integer val) {
        Integer ret = get(key);
        if (ret != null) {
            return ret;
        }
        return val;
    }

    //删除
    public Integer remove(Integer key) {
        int bucketNo = hashFunc(key);
        ListNode cur = table[bucketNo];
        ListNode pre = null;
        while (cur != null) {
            if (key.equals(cur.key)) {
                Integer oldVal = cur.val;
                if (cur == table[bucketNo]) {     //如果要删除的刚好是链表的第一个元素
                    table[bucketNo] = cur.next;
                    cur.next = null;
                    return oldVal;
                } else {
                    pre.next = cur.next;
                    cur.next = null;
                    return oldVal;
                }
            }
            size--;
            pre = cur;
            cur = cur.next;
        }
        return null;
    }

    //是否包含关键值为key的元素
    public boolean containsKey(Integer key) {
        return get(key) != null;
    }

    //查找是否有值为val的元素,O(N),遍历每一个val
    public boolean containsVal(Integer val) {
        for (int bucketNo = 0; bucketNo < table.length; bucketNo++) {
            ListNode cur = table[bucketNo];
            while (cur != null) {
                if (val.equals(cur.val)) {
                    return true;
                }
                cur = cur.next;
            }
        }
        return false;
    }

    //获取桶的个数
    public int size() {
        return size;
    }

}