BloomFilter 确定合适的 k(hash函数个数) 值.

来源:互联网 发布:卓越精算软件使用方法 编辑:程序博客网 时间:2024/06/05 14:09

参考 : https://llimllib.github.io/bloomfilter-tutorial/

假设元素的全集个数为 n, 过滤器槽为 m, 共有 k 个函数, 那么误判率为 (1-e^(-kn/m))^k

k 值最优的计算公式为 (m/n)ln(2)

所以, 我们可以根据如下步骤来判定布隆过滤器的初始化大小 m

  1. 决定你的元素输入个数 n 的大概值

  2. 为 m 选一个值

  3. 通过公式计算 k 的值

  4. 通过公式计算 误判率, 假如不满意, 则回到 2. 重新选择 m 值, 直到得出满意的误判率.

1 0
原创粉丝点击