7.哈希表
特点
-
优点
-
插入和删除元素效率高,O(1)时间级 -
速度比树还要快,编码较简单 -
缺点
哈希函数
- 哈希化: 将大数字转化成数组范围内下标的过程, 我们就称之为哈希化.
- 哈希函数: 通常我们会将单词转成大数字, 大数字在进行哈希化的代码实现放在一个函数中, 这个函数我们成为哈希函数.
- 哈希表: 最终将数据插入到的这个数组, 我们就称之为是一个哈希表
哈希化效率
装填因子:装填因子 = 总数据项 / 哈希表长度.
? 链地址法:可能大于1;开放地址法:最大为1
相对来说,链地址法效率是好于开放地址法的.
快速计算:霍纳法则
计算哈希值的时候使用的方式
霍纳算法:Pn(x)= anxn+a(n-1)x(n-1)+…+a1x+a0
? = ((…(((anx +an-1)x+an-2)x+ an-3)…)x+a1)x+a0
均匀分布
使用质数:
- 哈希表的长度.
- N次幂的底数(我们之前使用的是27)
哈希函数实现
function hashFunc(str, max) {
var hashCode = 0
for (var i = 0; i < str.length; i++) {
hashCode = 37 * hashCode + str.charCodeAt(i)
}
hashCode = hashCode % max
return hashCode
}
哈希表封装
function HashTable() {
this.storage = []
this.count = 0
this.limit = 8
HashTable.prototype.hashFunc = function(str, max) {
var hashCode = 0
for (var i = 0; i < str.length; i++) {
hashCode = 37 * hashCode + str.charCodeAt(i)
}
hashCode = hashCode % max
return hashCode
}
}
插入&修改数据
HashTable.prototype.put = function (key, value) {
var index = this.hashFunc(key, this.limit)
var bucket = this.storage[index]
if (bucket === undefined) {
bucket = []
this.storage[index] = bucket
}
alert(bucket)
var override = false
for (var i = 0; i < bucket.length; i++) {
var tuple = bucket[i]
if (tuple[0] === key) {
tuple[1] = value
override = true
}
}
if (!override) {
bucket.push([key, value])
this.count++
}
}
获取元素
HashTable.prototype.get = function (key) {
var index = this.hashFunc(key, this.limit)
var bucket = this.storage[index]
if (bucket == null) {
return null
}
for (var i = 0; i < bucket.length; i++) {
var tuple = bucket[i]
if (tuple[0] === key) {
return tuple[1]
}
}
return null
}
删除元素
HashTable.prototype.remove = function (key) {
var index = this.hashFunc(key, this.limit)
var bucket = this.storage[index]
if (bucket == null) {
return null
}
for (var i = 0; i < bucket.length; i++) {
var tuple = bucket[i]
if (tuple[0] === key) {
bucket.splice(i, 1)
this.count--
return tuple[1]
}
}
return null
}
判断哈希表是否为空: isEmpty
HashTable.prototype.isEmpty = function () {
return this.count == 0
}
获取哈希表中数据的个数
HashTable.prototype.size = function () {
return this.count
}
哈希表的扩容
-
因为我们使用的是链地址法, loadFactor可以大于1, 所以这个哈希表可以无限制的插入新数据. -
但是, 随着数据量的增多, 每一个index对应的bucket会越来越长, 也就造成效率的降低. -
比较常见的情况是loadFactor>0.75的时候进行扩容.
this.resize = function (newLimit) {
var oldStorage = this.storage
this.storage = []
this.count = 0
this.limit = newLimit
for (var i = 0; i < oldStorage.length; i++) {
var bucket = oldStorage[i]
if (bucket == null) {
continue
}
for (var j = 0; j < bucket.length; i++) {
var tuple = bucket[j]
this.put(tuple[0], tuple[1])
}
}
}
|