强大的和谐--高级的字符匹配算法

来源:互联网 发布:非我倾城网络续写 编辑:程序博客网 时间:2024/05/22 01:09
实现一个挺高级的字符匹配算法:
给一串很长字符串,要求找到符合要求的字符串,例如目的串:123
1******3***2 ,12*****3 这些都要找出来,其实就是类似一些和谐系统。。。。。

       这题的真正意思就是,给你一个目标串,如“123”,只要一个字符串里面同时包含1、2和3,那么这个字符串就匹配了。系统越和谐,说明错杀的可能行也就越大。加入目标串的长度为m,模式串的长度为n,我们很容易想到O(mn)的算法,就是两遍for循环搞定。那么有没有更快的方法呢?

       我们考虑问题的时候,如果想时间变得快,有一种方法就叫做“空间换时间”。哈希表是一种比较复杂的数据结构。由于比较复杂,STL中没有实现哈希表,因此需要我们自己实现一个。但由于本题的特殊性,我们只需要一个非常简单的哈希表就能满足要求。由于字符(char)是一个长度为8的数据类型,因此总共有可能256 种可能。于是我们创建一个长度为256的数组,每个字母根据其ASCII码值作为数组的下标对应数组的对应项,而数组中存储的0、1对应每个字符是否出现。这样我们就创建了一个大小为256,以字符ASCII码为键值的哈希表。(并不仅限于英文字符,所以这里要考虑256种可能)。

       知道了这点,我们可以构建一个数组来统计模式串中某个字符是否出现,然后在对目标串进行扫描,看看对应的所有位上是否出现,从而判断是否匹配。分析一下复杂度,大概是O(m+n)。

实现代码如下:

[cpp] view plaincopy
  1. //强大的和谐系统  
  2. int is_contain(char *src, char *des)  
  3. {  
  4.     //创建一个哈希表,并初始化  
  5.     const int tableSize = 256;  
  6.     int hashTable[tableSize];  
  7.     int len,i;  
  8.     for(i = 0; i < tableSize; i++)  
  9.         hashTable[i] = 0;  
  10.     len = strlen(src);  
  11.     for(i = 0; i < len; i++)  
  12.         hashTable[src[i]] = 1;  
  13.   
  14.     len = strlen(des);  
  15.     for(i = 0; i < len; i++)  
  16.     {  
  17.         if(hashTable[des[i]] == 0)  
  18.             return 0;         //匹配失败  
  19.     }  
  20.     return 1;    //匹配成功  
  21. }  
原创粉丝点击