Manacher算法求最长回文子串

来源:互联网 发布:我的世界命令方块编程 编辑:程序博客网 时间:2024/04/29 05:19

时间复杂度O(n)

算法的主要思想是从左到右处理字符串,求每个位置为中心的两端对称的最大半径。

void Manacher(char s[],int n,int radius[]){      int i,j;      for(i=1;i<n;i++) radius[i]=1;      for(i=2;i<n;i=j)      {           while(s[i-radius[i]]==s[i+radius[i]]) radius[i]++;  //求以当前位置为中心的最大对称半径           int rBnd=i+radius[i];           for(j=i+1;j<rBnd;j++) //对当前位置半径覆盖范围内右边的位置进行处理           {                 /*                 ** 如果位置j以位置i为中心的对称位置k=i-(j-i),它的最大半径被i的半径包含,那么j的最大半径就等于radius[k],根据对称性;                 ** 否则,也就是位置k的最长回文串的左端等于或者向左超过以i为中心的回文串的左端,那么j的最大半径至少为i+radius[i]-j;                 ** 这样,i~j中间位置的最大半径都求出来了,i下次直接从j开始扩展最大半径                 */                 if(j+radius[i-(j-i)]<rBnd)                        radius[j]=radius[i-(j-i)];                 else                 {                      radius[j]=rBnd-j;                      break;                 }           }      }}


虽然表面是双重循环,但我们分析一下,由于循环内部是每次从位置i扩展到下一个位置j,一直扩展到位置n,如果把外层循环,一层一层展开接起来,那就是常数倍从1n的运算,所以总起来的运算量是O(n)的。

网上较多的是下面这种写法:

void Manacher(intrad[],char str[],int n){   int i,mx=0,id;   for(i=1;i<n;i++)   {      if(mx>i) rad[i]=min(rad[2*id-i],mx-i);      else rad[i]=1;      for(;str[i+rad[i]]==str[i-rad[i]];rad[i]++)        ;      if(mx<rad[i]+i)      {        mx=rad[i]+i;        id=i;      }   }}




首先:大家都知道什么叫回文串吧,这个算法要解决的就是一个字符串中最长的回文子串有多长。这个算法可以在On)的时间复杂度内既线性时间复杂度的情况下,求出以每个字符为中心的最长回文有多长,
这个算法有一个很巧妙的地方,它把奇数的回文串和偶数的回文串统一起来考虑了。这一点一直是在做回文串问题中时比较烦的地方。这个算法还有一个很好的地方就是充分利用了字符匹配的特殊性,避免了大量不必要的重复匹配。
算法大致过程是这样。先在每两个相邻字符中间插入一个分隔符,当然这个分隔符要在原串中没有出现过。一般可以用‘#’分隔。这样就非常巧妙的将奇数长度回文串与偶数长度回文串统一起来考虑了(见下面的一个例子,回文串长度全为奇数了),然后用一个辅助数组P记录以每个字符为中心的最长回文串的信息。Pid]记录的是以字符strid]为中心的最长回文串,当以strid]为第一个字符,这个最长回文串向右延伸了Pid]个字符。
原串: w aa bwsw f d
新串: # w# a # a # b # w # s # w # f # d #
辅助数组P1 2 1 2 3 2 1 2 1 2 1 4 1 2 1 2 1 2 1
这里有一个很好的性质,Pid-1就是该回文子串在原串中的长度(包括‘#’)。如果这里不是特别清楚,可以自己拿出纸来画一画,自己体会体会。当然这里可能每个人写法不尽相同,不过我想大致思路应该是一样的吧。
好,我们继续。现在的关键问题就在于怎么在On)时间复杂度内求出P数组了。只要把这个P数组求出来,最长回文子串就可以直接扫一遍得出来了。
由于这个算法是线性从前往后扫的。那么当我们准备求Pi]的时候,i以前的Pj]我们是已经得到了的。我们用mx记在i之前的回文串中,延伸至最右端的位置。同时用id这个变量记下取得这个最优mx时的id值。(注:为了防止字符比较的时候越界,我在这个加了‘#’的字符串之前还加了另一个特殊字符‘$’,故我的新串下标是从1开始的)
好,到这里,我们可以先贴一份代码了。


代码是不是很短啊,而且相当好写。很方便吧,还记得我上面说的这个算法避免了很多不必要的重复匹配吧。这是什么意思呢,其实这就是一句代码。

if( mx > i)
p[i]=MIN( p[2*id-i], mx-i);

就是当前面比较的最远长度mx>i的时候,Pi]有一个最小值。这个算法的核心思想就在这里,为什么P数组满足这样一个性质呢?