1 ARC(Adaptive Replacement Cache): 自适应缓存替换算法,它结合了LRU与LFU,来获得可用缓存的最佳使用。
核心思想是:当时访问的数据趋向于访问最近的内容,会更多地命中LRU list,这样会增大LRU的空间; 当系统趋向于访问最频繁的内容,会更多地命中LFU list,这样会增加LFU的空间.
- 整个Cache分成两部分,起始LRU和LFU各占一半,后续会动态适应调整partion的位置(记为p)
- 除此,LRU和LFU各自有一个ghost list(因此,一共4个list)
- 每次,被淘汰的item放到对应的ghost list中(ghost list只存key), 例如:如果被evicted的item来自LRU的部分, 则该item对应的key会被放入LRU对应的ghost list
- 第一次cache miss, 则会放入LRU
- 如果cache hit, 如果LFU中没有,则放入LFU
- 如果cache miss, 但在ghost list中命中,这说明对应的cache需要扩容: 如果存在于LRU ghost list, 则p=p+1;否则存在于LFU ghost list, p=p-1.
- 也就是说,利用这种适应机制,当系统趋向于访问最近的内容,会更多地命中LRU ghost list,这样会增大LRU的空间; 当系统趋向于访问最频繁的内容,会更多地命中LFU ghost list,这样会增加LFU的空间.
2 LRU(Least Recently User) 最近最少使用算法,根据数据的历史访问记录来进行淘汰数据
核心思想是:最近使用的数据很大概率将会再次被使用。而最近一段时间都没有使用的数据,很大概率不会再使用。
- ? ? ? ? ? 假设刚visit的item,很有可能在未来被revisit
- ? ? ? ? ? 丢弃最近最少访问的items
- ? ? ? ? ? 通常用双链表实现 tips: redis并没有这样做,因为这样每个key至少会多出两个指针。 redis采用的是一种近似LRU,基本思想是随机取出一些key,形成一个小的POOL,然后在pool中采用LRU策略(相关源码:redis/src/evict.c)
- 缺点:忽略了frequency, 不适合大规模扫描等情况,
- ? ? ? ?缓存污染,如果某个客户端访问大量历史数据时,可能使缓存中的数据被这些历史数据替换,其他客户端访问数据的命中率大大降低。
- tips:LRU有一系列变种,比如LRU2, 2Q, LIRS等。
3 LFU(Least Frequently Used): 最近最不常用算法,根据数据的历史访问频率来淘汰数据 ? ? ? ? ? ? ? ? ? ? ? ? ? ? 假设visit次数越多的item,很有可能在未来被revisit ? ? ? ? ? ? ? ? ? ? ? ? ? ? 适应大规模扫描 ? ? ? ? ? ? ? ? ? ? ? ? ? ? 对热点友好 缺点:忽略了recency, 可能会积累不再使用的数据? ? ? 某些数据短时间内被重复引用,并且在很长一段时间内不再被访问。由于它的访问频率计数急剧增加,即使它在相当长的一段时间内不会被再次使用,也不会在短时间内被淘汰。这使得其他可能更频繁使用的块更容易被清除,此外,刚进入缓存的新项可能很快就会再次被删除,因为它们的计数器较低,即使之后可能会频繁使用。
tips: redis4.0开始支持了LFU,例如volatile-lfu, allkeys-lfu配置选项
|