2017-07-18:哈希表(POJ1200:Crazy Search)

来源:互联网 发布:网络推广收费 编辑:程序博客网 时间:2024/05/21 09:47

找hash最好是双hash,即分别mod两个不同的质数

第一种找哈希值的办法

转换进制

题中所述字符串中出现的字符个数为NC,则可以将其所有长度为N的子串Hash为NC进制的数,最后统计Hash的个数即可。

STEP1:记录没有出现过的字符所转化的数字,注意数字从0开始

for (int i=1;i<=len;i++){    if (id[w[i]]!=-1) continue;    id[w[i]]=cnt;    cnt++;    if (cnt>nc) break;}

STEP2:将子串转化为NC进制的数并统计个数

for (int i=1;i<=len-n+1;i++){    s=0;    for (int j=i;j<=i+n-1;j++)        s=s*nc+id[w[j]];    if (!hash[s]){        ans++;        hash[s]=1;    }}

第二种找哈希值的办法

一般哈希和二分答案都是合在一起考的

mod的质数不要太大,因为要平方,一般用31

例题如给出两个字符串,找从最后一个字符开始的最长相同字符串的长度
STEP1:在读入时就找出每一个字符及其前缀的哈希值
如abcd:
hash[1]=1;
hash[2]=hash[1]*31+2;
hash[3]=hash[2]*31+3;
hash[4]=hash[3]*31+4;
STEP2:选一个串来二分,二分出的长度是另一个串要找的长度,比较hash值,合法就继续向前找hash值,不合法就向后

如何找hash值:

令末尾为right,二分出的开头为mid,求出的值即为x=hash[right]-hash[mid]*31^(right-mid)
因为长度不同,所以hash[mid]需要乘上31的长度差次方之后再相减,使长度相同(补0)

原创粉丝点击