IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 数据结构与算法 -> 哈希表总结 -> 正文阅读

[数据结构与算法]哈希表总结

哈希表的核心问题就是如何解决冲突/碰撞(不同的关键码通过hash函数得到了一个相同的下标)问题

方法有两种 (1)降低产生冲突的可能性 (2)是解决冲突

(1)降低产生冲突的可能性(哈希冲突无法避免):

1.设计哈希函数 例:数据集合{1,8,6,7,4,3}? ,设计hash函数为 hash(key) == key % capacity(储存元素底层空间的总大小)? 常见的设计方法 :

1.?直接定制法--(常用)
取关键字的某个线性函数为散列地址:Hash(Key)=?A*Key?+?B?优点:简单、均匀?缺点:需要事先知道关键字的分布情况?使用场景:适合查找比较小且连续的情况?
2.?除留余数法--(常用)
设散列表中允许的地址数为m,取一个不大于m,但最接近或者等于m的质数p作为除数,按照哈希函数:?Hash(key)?=?key%?p(p<=m),将关键码转换成哈希地址 (上面例子用的方法)
3.?平方取中法
假设关键字为1234,对它平方就是1522756,抽取中间的3位227作为哈希地址;?再比如关键字为4321,对?它平方就是18671041,抽取中间的3位671(或710)作为哈希地址?平方取中法比较适合:不知道关键字的分?布,而位数又不是很大的情况
?
??? ? ? ? ? ??

2.调节负载因子 ,负载因子=当前存放数据元素的个数/散列表的长度, 一般负载因子越大冲突率就越高 HashMap的负载因子最大为0.75 ,超过0.75 就需要扩容了

扩容机制:当每次扩容时,哈希表的容量增加为原来的两倍,当扩容完且rehash后才会继续插入触发扩容的数据。

(2)常见的解决冲突的方法:

1.闭散列(开放地址法)当发生哈希冲突时,哈希表未被装满,就可以把key放到冲突位置的“下一个”空位置去? 。

包含两种方法 (1)线性探测法(从冲突的位置依次向后探测直到找到下一个空位置为止)

?缺点:由于冲突时是挨着向后找下一个空位置的 ,所以会导致冲突的数据都堆积在一块?

注意:采用闭散列处理哈希冲突时,不能随便物理删除哈希表中已有的元素,若直接删除元素会影响其它元素的搜索。比如删除元素4,如果直接删除掉,34查找起来可能会受影响。因此线性探测采用标记的伪删除法来删除一个元素。

(2)二次探测(下一个空位置= (hash(key)+i2) % capacity)i是hash(key)第几次找空位置,从i从1开始 如果i=1时找到的位置还是冲突的 ,i就+1,直到找到下一个空位置为止。

就还以上图为例子 hash(34) = 34 % 10 = 4 发生了冲突 这时用二次探测法 hash(34) =(4 + 12) % 10 = 5 还是发生了冲突 于是 hash(34) = (4 + 22)%10 = 8 找到了空位置 就把34放在8这个位置?

研究表明当表的长度为质数且表装载因子 a 不超过 0.5 时,新的表项一定能够插入,而且任何一个位置都不 会被探查两次。因此只要表中有一半的空位置,就不会存在表满的问题。在搜索时可以不考虑表装满的情况,但在插入时必须确保表的装载因子a不超过 0.5 ,如果超出必须考虑增容。

所以闭散列的最大缺点就是空间利用比较率低,这也是哈希的缺陷 。

2.开散列/哈希桶(链地址法)

先对关键码集合用哈希函数定位,每个位置相同的关键码(key)都存在同一个子集合中,每一个子集合又叫做一个桶,桶中的各个元素通过一个单链表连接起来,各链表的头节点存放在哈希表中

其他知识:

1.哈希表的插入,删除,查找操作的时间复杂度都是O(1)。

2.Java中的HashMap ,HashSet就是利用哈希表实现的Map和Set。

3.Java中解决冲突使用的时开散列也就是哈希桶 来解决的。

4.Java会在冲突链表的长度达到一定的阈值后(8),将链表转化为红黑树。?

5.hashCode和equals方法 前者是用来计算key的哈希值,以达到定位的效果(就是找到哈希表中链表头节点所在的位置下标),而后者就是从找到的头节点向链表尾部遍历去与key比较相等性。

如果两个对象相同,hashCode一定相同。
但是hashCode相同的两个对象不一定相同。(可能是同一个hashCode定位到的链表头节点的不同后续节点)
而如果两个对象相同,equals()方法得到的一定为true。

注:如果是自定义的类 要作为HashMap的key值,或者HashSet的值的时候必须根据类来重写hashCode方法和equals方法。

  数据结构与算法 最新文章
【力扣106】 从中序与后续遍历序列构造二叉
leetcode 322 零钱兑换
哈希的应用:海量数据处理
动态规划|最短Hamilton路径
华为机试_HJ41 称砝码【中等】【menset】【
【C与数据结构】——寒假提高每日练习Day1
基础算法——堆排序
2023王道数据结构线性表--单链表课后习题部
LeetCode 之 反转链表的一部分
【题解】lintcode必刷50题<有效的括号序列
上一篇文章      下一篇文章      查看所有文章
加:2021-08-19 12:18:53  更:2021-08-19 12:20:02 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/28 17:20:10-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码
数据统计