题目:海量数据处理,40亿个不重复的unsigned int的整数,如何判断某数是否在其中?

来源:互联网 发布:微星淘宝旗舰店 编辑:程序博客网 时间:2024/06/05 23:01

给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?

速度相当的快,应该是在小于o(n)的时间内就可以解决问题。但是rand()产生的随机数范围有限制,可以想想其他办法产生随机数。可以看到,所用到的内存很小,而且程序反应速度也很快。这种方法是基于要寻找数的本身特性。也可以成为bit magic。这就是比特位的强大魅力所在。首先,判断所要寻找数字x的最高比特位是1还是0,假设为1,这样可以根据40亿个数的最高位是1还是0进行操作,是0的直接舍去,是1的保留,可以看到题目所说,40亿个数都是不重复的,这样可以保证最高位1和0分布是均匀的,剩下的就应该是20个数,然后再取x的次高位,根据是1还是0将剩下的整数分类,这样经过31一趟分类之后,剩下数字的前31位都和要寻找的数字的高31位一样,那么,可以直接寻找剩下的数字中是否有我们要寻找的数字。为了节省时间就没有弄40亿个数字。最重要的是明白原理就好。

[cpp] view plaincopy
  1. #include<iostream>  
  2. #include<string.h>  
  3. #include<ctime>  
  4. using namespace std;  
  5. #define N 1000000  
  6. // i 从 0 到 31 分别代表最高位到最低位  
  7. int is_bit_one(int n, int i) {  
  8.     return n & (1 << (32 - i - 1));  
  9. }  
  10.   
  11. void swap_path(char **a, char **b) {  
  12.     char *temp;  
  13.     temp = *a;  
  14.     *a = *b;  
  15.     *b = temp;  
  16. }  
  17. void main() {  
  18.     FILE *fin;  
  19.     FILE *fout;  
  20.     char *source = "source.txt";  
  21.     char *result = "result.txt";  
  22.     if((fin = fopen(source, "w")) == NULL) {  
  23.         cout << "open source file failed!" << endl;  
  24.         return;  
  25.     }  
  26.     int i = 0;  
  27.     int num = 0;  
  28.     int find_num = 8;  
  29.     srand((unsigned)time(NULL));  
  30.     while(i < N) {  
  31.         num = rand() % N;  
  32.         fprintf(fin, "%d ", num);  
  33.         i++;  
  34.     }  
  35.     fclose(fin);  
  36.     for(i = 0; i < 32; i++) {  
  37.         fin = fopen(source, "r");  
  38.         fout = fopen(result, "w");  
  39.         if(is_bit_one(find_num, i)) {  
  40.             while(fscanf(fin, "%d", &num) != EOF) {  
  41.                 if(num >= 0 &&is_bit_one(num, i)) {  
  42.                     fprintf(fout, "%d " , num);  
  43.                 }  
  44.             }  
  45.         } else {  
  46.             while(fscanf(fin, "%d", &num) != EOF) {  
  47.                 if(!is_bit_one(num, i) && num >= 0) {  
  48.                     fprintf(fout, "%d " , num);  
  49.                 }  
  50.             }  
  51.         }  
  52.         fclose(fin);  
  53.         fclose(fout);  
  54.         swap_path(&source, &result);  
  55.     }  


0 0
原创粉丝点击