命令
// 添加
> PFADD name feikong zhongming hongmeng
> 1
> PFADD name feikong feikong feikong
> 0
> PFADD report feikong jingyan zhenlong
> 1
// 查看
> PFCOUNT name
> 3
> PFCOUNT name report
> 5
意义
在对大量数据进行统计时,采用hll可以在允许一定误差率副作用前提下,实现超低的内存消耗完成数据基数统计。这里有三个点要注意:
- 大量:少量就直接load内存得了。
- 统计:如果保存被统计项的具体内容,那也不行,只能用于统计数量。
- 基数:即distinct的含义,同值只能算一个。
根据计算,可以用12KB的内存大小,完成2^64个数据的统计,误差率低于0.81%。