命令

  1. // 添加
  2. > PFADD name feikong zhongming hongmeng
  3. > 1
  4. > PFADD name feikong feikong feikong
  5. > 0
  6. > PFADD report feikong jingyan zhenlong
  7. > 1
  8. // 查看
  9. > PFCOUNT name
  10. > 3
  11. > PFCOUNT name report
  12. > 5

意义

在对大量数据进行统计时,采用hll可以在允许一定误差率副作用前提下,实现超低的内存消耗完成数据基数统计。这里有三个点要注意:

  • 大量:少量就直接load内存得了。
  • 统计:如果保存被统计项的具体内容,那也不行,只能用于统计数量。
  • 基数:即distinct的含义,同值只能算一个。

根据计算,可以用12KB的内存大小,完成2^64个数据的统计,误差率低于0.81%。

原理

https://zhuanlan.zhihu.com/p/382162553