IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 数据结构与算法 -> 哈希表详解 -> 正文阅读

[数据结构与算法]哈希表详解

哈希表

哈希表是数组的一种扩展,底层依赖数组支持按照下标快速访问元素的特性,可以通过hash函数将元素的键值映射为下标,然后将对应下标的数据存储在数组中的对应位置。当按照键值查询元素时,使用相同的Hash函数将key转换为数组的下标,从数组中按照下标对应的位置获取数据。

键必须唯一,不允许重复,每个key只能映射一个value,Hash冲突,由于映射的范围限制,key取值的可能性大于映射范围,出现两个不同的key映射到同一个位置

哈希函数

  • 哈希函数计算达到的哈希值应该是一个非负整数
  • 如果key1==key2,那么hash(key1)==hash(key2)
  • 如果key1!=key2,那么hash(key1)!=hash(key2)。看起来合理,但实际上不可能实现,因为数组的存储空间有限,所以加大了哈希冲突的概率。

即使两个key的hash值相等,但是又可能key值不相等

哈希函数常常应用于:安全加密、唯一标识、数据校验、负载均衡、数据分片和分布式存储等,不同场景下对哈希函数的要求不同

哈希冲突

解决哈希冲突的常见方法有开放地址法和链表法
开放地址法: 一旦出现Hash值冲突则通过重新位置的探索整个哈希表,时间复杂度为O(n)
链表法: 链地址法,再具体的应用中使用较多,在哈希表汇总每个桶对应一个链表,把哈希值相同的元素存放在相同桶位置的对应链表中,由于需要对比key值所以插入时间复杂度为O(k),查找和删除时的时间复杂度与链表的长度成正比O(k),一般当k值不是很大时可以粗略的认为O(1)。需要尽量减少链表长度,可以引入一个参数:负载因子。负载因子用于间接的限定链表的长度,如果值越大则允许的链表长度越长,哈希表的性能越差,但是加载因子越小空浪费越严重。

哈希表的设计

哈希函数的设计首先不能过于复杂,复杂的哈希函数会间接的影响hash表的性能;其次要求哈希值应该尽可能随机且均匀分布,避免或者减少哈希冲突的数量,使每个桶中存储的数据比较平均常规的设计方法有数据分析法,选择数据的业务特征提取部分数据进行计算,然后得到结果再与哈希表数组的长度求余后最为哈希值。另外还有直接寻址法、平方取中法、折叠法和随机数法等。

加载因子问题

加载因子越大,哈希表中存储的元素越多,空闲的位置就越少,哈希冲突的概率就越大,插入、删除和
查找数据时的性能就随之降低。
针对静态数据集是比较容易处理的,但是动态数据集无法申请一个足够大的哈希表,所以必须考虑扩容
问题。扩容实际上就是重新申请内存空间,重新计算每个数据的哈希值,并且将数据从原来的hash表搬
移到新的哈希表中,最坏的情况下O(n),从道理上来说,利用时间复杂度的摊还分析法,摊还后时间复
杂度可以接近最好的时间复杂度。但是针对本次操作绝对是一个问题
一般来说在空间和时间之间进行平衡,如果内存空间不紧张,对执行效率要求较高,可以选择小一点的
阈值;相反如果内存空间比较紧张,对执行效率要求不高,可以适当选择大一点的阈值,甚至在基于链
表法的实现中可以大于1

扩容

扩容处理相对于增删来说是非常低效的,如果相应时间要求高,尽管大部分情况下,插入数据的速度很
快,但是极个别情况插入速度非常慢,会导致用户崩溃的。就是扩容时每次扩容是容积乘以2,因为扩容
处理后的元素有2种情况,一种是位置不变,一种后移同上一次容积
例如原始数组长度为16,则原始hash值为16\32\48\0对应的位置都是0;当扩容到32时,会发现0\32位
置不变,但是16\48后移16个位置

  数据结构与算法 最新文章
【力扣106】 从中序与后续遍历序列构造二叉
leetcode 322 零钱兑换
哈希的应用:海量数据处理
动态规划|最短Hamilton路径
华为机试_HJ41 称砝码【中等】【menset】【
【C与数据结构】——寒假提高每日练习Day1
基础算法——堆排序
2023王道数据结构线性表--单链表课后习题部
LeetCode 之 反转链表的一部分
【题解】lintcode必刷50题<有效的括号序列
上一篇文章      下一篇文章      查看所有文章
加:2022-07-04 23:13:18  更:2022-07-04 23:13:29 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/25 23:50:17-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码