题目描述:

链接:https://leetcode-cn.com/problems/lfu-cache

请你为 最不经常使用(LFU)缓存算法设计并实现数据结构。

实现 LFUCache 类:

  • LFUCache(int capacity) - 用数据结构的容量 capacity 初始化对象
  • int get(int key) - 如果键存在于缓存中,则获取键的值,否则返回 -1。
  • void put(int key, int value) - 如果键已存在,则变更其值;如果键不存在,请插入键值对。当缓存达到其容量时,则应该在插入新项之前,使最不经常使用的项无效。在此问题中,当存在平局(即两个或更多个键具有相同使用频率)时,应该去除 最近最久未使用 的键。

注意「项的使用次数」就是自插入该项以来对其调用 getput 函数的次数之和。使用次数会在对应项被移除后置为 0 。

为了确定最不常使用的键,可以为缓存中的每个键维护一个 使用计数器 。使用计数最小的键是最久未使用的键。

当一个键首次插入到缓存中时,它的使用计数器被设置为 1 (由于 put 操作)。对缓存中的键执行 get 或 put 操作,使用计数器的值将会递增。

示例:

输入:
[“LFUCache”, “put”, “put”, “get”, “put”, “get”, “get”, “put”, “get”, “get”, “get”]
[[2], [1, 1], [2, 2], [1], [3, 3], [2], [3], [4, 4], [1], [3], [4]]
输出:
[null, null, null, 1, null, -1, 3, null, -1, 3, 4]

解释:
// cnt(x) = 键 x 的使用计数
// cache=[] 将显示最后一次使用的顺序(最左边的元素是最近的)
LFUCache lFUCache = new LFUCache(2);
lFUCache.put(1, 1); // cache=[1,_], cnt(1)=1
lFUCache.put(2, 2); // cache=[2,1], cnt(2)=1, cnt(1)=1
lFUCache.get(1); // 返回 1
// cache=[1,2], cnt(2)=1, cnt(1)=2
lFUCache.put(3, 3); // 去除键 2 ,因为 cnt(2)=1 ,使用计数最小
// cache=[3,1], cnt(3)=1, cnt(1)=2
lFUCache.get(2); // 返回 -1(未找到)
lFUCache.get(3); // 返回 3
// cache=[3,1], cnt(3)=2, cnt(1)=2
lFUCache.put(4, 4); // 去除键 1 ,1 和 3 的 cnt 相同,但 1 最久未使用
// cache=[4,3], cnt(4)=1, cnt(3)=2
lFUCache.get(1); // 返回 -1(未找到)
lFUCache.get(3); // 返回 3
// cache=[3,4], cnt(4)=1, cnt(3)=3
lFUCache.get(4); // 返回 4
// cache=[3,4], cnt(4)=2, cnt(3)=3

额外要求:get和put方法的时间复杂度为O(1)

解题思路:

1、不考虑额外要求,采用hashmap+treemap即可(java中两个数据结构均有实现)。

2、自己的版本(自己实现双链表+两个哈希表,麻烦的地方在于更细minfre)

  1. package leetcode.cache;
  2. import java.util.HashMap;
  3. public class LFUCache {
  4. private int capacity;
  5. private int size;
  6. HashMap<Integer, Node> smap = new HashMap<>();
  7. HashMap<Integer, DoubleList> fmap = new HashMap<>();
  8. //找最少频率的策略
  9. int minfre = Integer.MAX_VALUE;
  10. Node minfreNode;
  11. //节点
  12. static class Node {
  13. Integer key;
  14. Integer value;
  15. Node next;
  16. Node prev;
  17. int freq;
  18. public Node(Integer key, Integer value) {
  19. this.key = key;
  20. this.value = value;
  21. freq = 1;
  22. }
  23. public Node() {
  24. }
  25. }
  26. //双链表
  27. static class DoubleList {
  28. Node head;
  29. Node tail;
  30. public DoubleList() {
  31. head = new Node();
  32. tail = new Node();
  33. head.next = tail;
  34. tail.prev = head;
  35. }
  36. public void insertAhead(Node node) {
  37. node.next = head.next;
  38. head.next.prev = node;
  39. head.next = node;
  40. node.prev = head;
  41. }
  42. public void remove(Node node) {
  43. node.next.prev = node.prev;
  44. node.prev.next = node.next;
  45. }
  46. public Node getLast() {
  47. if (tail.prev == head) {
  48. return null;
  49. }
  50. return this.tail.prev;
  51. }
  52. }
  53. public LFUCache(int capacity) {
  54. this.capacity = capacity;
  55. }
  56. public int get(int key) {
  57. Node tmp = smap.get(key);
  58. if (tmp == null) {
  59. return -1;
  60. }
  61. updateNode(tmp);
  62. //更新minNode的策略
  63. if (tmp == minfreNode) {
  64. DoubleList tmpd = fmap.get(tmp.freq - 1);
  65. if (tmpd.getLast() != null) {
  66. minfreNode = tmpd.getLast();
  67. } else {
  68. minfre = tmp.freq;
  69. }
  70. }
  71. return tmp.value;
  72. }
  73. private void updateNode(Node node) {
  74. DoubleList tmpList = fmap.get(node.freq);
  75. tmpList.remove(node);
  76. node.freq++;
  77. tmpList = fmap.get(node.freq);
  78. if (tmpList == null) {
  79. fmap.put(node.freq, new DoubleList());
  80. tmpList = fmap.get(node.freq);
  81. }
  82. tmpList.insertAhead(node);
  83. }
  84. public void put(int key, int value) {
  85. if (capacity == 0) {
  86. return;
  87. }
  88. Node tmp = smap.get(key);
  89. if (tmp != null) {
  90. tmp.value = value;
  91. updateNode(tmp);
  92. //更新minfre
  93. if (tmp == minfreNode) {
  94. DoubleList tmpd = fmap.get(tmp.freq - 1);
  95. if (tmpd.getLast() != null) {
  96. minfreNode = tmpd.getLast();
  97. } else {
  98. minfre = tmp.freq;
  99. }
  100. }
  101. } else {
  102. if (size >= capacity) {
  103. DoubleList doubleList = fmap.get(minfre);
  104. if (minfreNode == doubleList.getLast()) {
  105. minfre = Integer.MAX_VALUE;
  106. minfreNode = null;
  107. }
  108. Integer rkey = doubleList.getLast().key;
  109. smap.remove(rkey);
  110. doubleList.remove(doubleList.getLast());
  111. size--;
  112. }
  113. Node node = new Node(key, value);
  114. smap.put(key, node);
  115. //设置最小频率
  116. if (node.freq < minfre) {
  117. minfreNode = node;
  118. minfre = node.freq;
  119. }
  120. DoubleList tmpList = fmap.get(node.freq);
  121. //如果没有对应的频率链表则新创建
  122. if (tmpList == null) {
  123. fmap.put(node.freq, new DoubleList());
  124. tmpList = fmap.get(node.freq);
  125. }
  126. tmpList.insertAhead(node);
  127. size++;
  128. }
  129. }
  130. //测试
  131. public static void main(String[] args) {
  132. LFUCache lfuCache = new LFUCache(2);
  133. lfuCache.put(1, 1);
  134. lfuCache.put(2, 2);
  135. System.out.println(lfuCache.get(1));
  136. lfuCache.put(3, 3);
  137. System.out.println(lfuCache.get(2));
  138. System.out.println(lfuCache.get(3));
  139. lfuCache.put(4, 4);
  140. System.out.println(lfuCache.get(1));
  141. System.out.println(lfuCache.get(3));
  142. System.out.println(lfuCache.get(4));
  143. }
  144. }

2、官方解答

class LFUCache {
    int minfreq, capacity;
    Map<Integer, Node> key_table;
    Map<Integer, LinkedList<Node>> freq_table;

    public LFUCache(int capacity) {
        this.minfreq = 0;
        this.capacity = capacity;
        key_table = new HashMap<Integer, Node>();;
        freq_table = new HashMap<Integer, LinkedList<Node>>();
    }

    public int get(int key) {
        if (capacity == 0) {
            return -1;
        }
        if (!key_table.containsKey(key)) {
            return -1;
        }
        Node node = key_table.get(key);
        int val = node.val, freq = node.freq;
        freq_table.get(freq).remove(node);
        // 如果当前链表为空,我们需要在哈希表中删除,且更新minFreq
        if (freq_table.get(freq).size() == 0) {
            freq_table.remove(freq);
            if (minfreq == freq) {
                minfreq += 1;
            }
        }
        // 插入到 freq + 1 中
        LinkedList<Node> list = freq_table.getOrDefault(freq + 1, new LinkedList<Node>());
        list.offerFirst(new Node(key, val, freq + 1));
        freq_table.put(freq + 1, list);
        key_table.put(key, freq_table.get(freq + 1).peekFirst());
        return val;
    }

    public void put(int key, int value) {
        if (capacity == 0) {
            return;
        }
        if (!key_table.containsKey(key)) {
            // 缓存已满,需要进行删除操作
            if (key_table.size() == capacity) {
                // 通过 minFreq 拿到 freq_table[minFreq] 链表的末尾节点
                Node node = freq_table.get(minfreq).peekLast();
                key_table.remove(node.key);
                freq_table.get(minfreq).pollLast();
                if (freq_table.get(minfreq).size() == 0) {
                    freq_table.remove(minfreq);
                }
            }
            LinkedList<Node> list = freq_table.getOrDefault(1, new LinkedList<Node>());
            list.offerFirst(new Node(key, value, 1));
            freq_table.put(1, list);
            key_table.put(key, freq_table.get(1).peekFirst());
            minfreq = 1;
        } else {
            // 与 get 操作基本一致,除了需要更新缓存的值
            Node node = key_table.get(key);
            int freq = node.freq;
            freq_table.get(freq).remove(node);
            if (freq_table.get(freq).size() == 0) {
                freq_table.remove(freq);
                if (minfreq == freq) {
                    minfreq += 1;
                }
            }
            LinkedList<Node> list = freq_table.getOrDefault(freq + 1, new LinkedList<Node>());
            list.offerFirst(new Node(key, value, freq + 1));
            freq_table.put(freq + 1, list);
            key_table.put(key, freq_table.get(freq + 1).peekFirst());
        }
    }

}
class Node {
    int key, val, freq;

    Node(int key, int val, int freq) {
        this.key = key;
        this.val = val;
        this.freq = freq;
    }

}

两种方法的主要区别在于保存和更新最小频率节点的策略,同时如果是在面试的时候双链表一般会要求自己手动实现。

总结:LRU和LFU的区别与使用场景:

mysql同时使用lfu和lru策略来管理缓存,lfu用于刷新脏页,lru用于管理结果页的缓存。

以下摘自https://www.jianshu.com/p/1f8e36285539
LRU,最近最少使用,把数据加入一个链表中,按访问时间排序,发生淘汰的时候,把访问时间最旧的淘汰掉。
比如有数据 1,2,1,3,2
此时缓存中已有(1,2)
当3加入的时候,得把后面的2淘汰,变成(3,1)
LFU,最近不经常使用,把数据加入到链表中,按频次排序,一个数据被访问过,把它的频次+1,发生淘汰的时候,把频次低的淘汰掉。
比如有数据 1,1,1,2,2,3
缓存中有(1(3次),2(2次))
当3加入的时候,得把后面的2淘汰,变成(1(3次),3(1次))
区别:LRU 是得把 1 淘汰。
显然
LRU对于循环出现的数据,缓存命中不高
比如,这样的数据,1,1,1,2,2,2,3,4,1,1,1,2,2,2…..
当走到3,4的时候,1,2会被淘汰掉,但是后面还有很多1,2
LFU对于交替出现的数据,缓存命中不高
比如,1,1,1,2,2,3,4,3,4,3,4,3,4,3,4,3,4……
由于前面被(1(3次),2(2次))
3加入把2淘汰,4加入把3淘汰,3加入把4淘汰,然而3,4才是最需要缓存的,1去到了3次,谁也淘汰不了它了。

作者:ck2016
链接:https://www.jianshu.com/p/1f8e36285539
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。