hash算法比较

来源:互联网 发布:网络骚扰电话打不停 编辑:程序博客网 时间:2024/05/29 15:10

pymemcached和xmemcached都实现了一致性哈希算法(其实我是照抄的),这里要测试下在使用一致性哈希的情况下,增加节点,看不同散列函数下命中率和数据分布的变化情况,这个测试结果对于spymemcached和xmemcached是一样的,测试场景:
从一篇英文小说(《黄金罗盘》前三章)进行单词统计,并将最后的统计结果存储到memcached,以单词为key,以次数为value。单词个数为 3061,memcached原来节点数为10,运行在局域网内同一台服务器上的不同端口,在存储统计结果后,增加两个memcached节点(也就是从10个节点增加到12个节点),统计此时的缓存命中率并查看数据的分布情况。
结果如下表格,命中率一行表示增加节点后的命中率情况(增加前为100%),后续的行表示各个节点存储的单词数,CRC32_HASH表示采用CRC32 散列函数,KETAMA_HASH是基于md5的散列函数也是默认情况下一致性哈希的推荐算法,FNV1_32_HASH就是FNV 32位散列函数,NATIVE_HASH就是java.lang.String.hashCode()方法返回的long取32位的结 果,MYSQL_HASH是xmemcached添加的传说来自于mysql源码中的哈希函数。

 CRC32_HASHKETAMA_HASHFNV1_32_HASHNATIVE_HASHMYSQL_HASH命中率78.5%83.3%78.2%99.89%86.9%节点13193665463596271节点23993501911233节点34133624910665节点4393364214142节点54644034271421节点64723062990285节点72833471230635节点83823872572408节点9238341297055节点102393757560586范围200~500300~400150~7500~360050~650

单纯比较下散列函数的计算效率:

CRC32_HASH:3266
KETAMA_HASH:7500
FNV1_32_HASH:375
NATIVE_HASH:187
MYSQL_HASH:500

NATIVE_HASH > FNV1_32_HASH > MYSQL_HASH > CRC32_HASH > KETAMA_HASH

0 0
原创粉丝点击