题目:海量数据处理,40亿个不重复的unsigned int的整数,如何判断某数是否在其中?
来源:互联网 发布:微星淘宝旗舰店 编辑:程序博客网 时间:2024/06/05 23:01
给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?
速度相当的快,应该是在小于o(n)的时间内就可以解决问题。但是rand()产生的随机数范围有限制,可以想想其他办法产生随机数。可以看到,所用到的内存很小,而且程序反应速度也很快。这种方法是基于要寻找数的本身特性。也可以成为bit magic。这就是比特位的强大魅力所在。首先,判断所要寻找数字x的最高比特位是1还是0,假设为1,这样可以根据40亿个数的最高位是1还是0进行操作,是0的直接舍去,是1的保留,可以看到题目所说,40亿个数都是不重复的,这样可以保证最高位1和0分布是均匀的,剩下的就应该是20个数,然后再取x的次高位,根据是1还是0将剩下的整数分类,这样经过31一趟分类之后,剩下数字的前31位都和要寻找的数字的高31位一样,那么,可以直接寻找剩下的数字中是否有我们要寻找的数字。为了节省时间就没有弄40亿个数字。最重要的是明白原理就好。
- #include<iostream>
- #include<string.h>
- #include<ctime>
- using namespace std;
- #define N 1000000
- // i 从 0 到 31 分别代表最高位到最低位
- int is_bit_one(int n, int i) {
- return n & (1 << (32 - i - 1));
- }
- void swap_path(char **a, char **b) {
- char *temp;
- temp = *a;
- *a = *b;
- *b = temp;
- }
- void main() {
- FILE *fin;
- FILE *fout;
- char *source = "source.txt";
- char *result = "result.txt";
- if((fin = fopen(source, "w")) == NULL) {
- cout << "open source file failed!" << endl;
- return;
- }
- int i = 0;
- int num = 0;
- int find_num = 8;
- srand((unsigned)time(NULL));
- while(i < N) {
- num = rand() % N;
- fprintf(fin, "%d ", num);
- i++;
- }
- fclose(fin);
- for(i = 0; i < 32; i++) {
- fin = fopen(source, "r");
- fout = fopen(result, "w");
- if(is_bit_one(find_num, i)) {
- while(fscanf(fin, "%d", &num) != EOF) {
- if(num >= 0 &&is_bit_one(num, i)) {
- fprintf(fout, "%d " , num);
- }
- }
- } else {
- while(fscanf(fin, "%d", &num) != EOF) {
- if(!is_bit_one(num, i) && num >= 0) {
- fprintf(fout, "%d " , num);
- }
- }
- }
- fclose(fin);
- fclose(fout);
- swap_path(&source, &result);
- }
- }
0 0
- 题目:海量数据处理,40亿个不重复的unsigned int的整数,如何判断某数是否在其中?
- 给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?
- 给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?
- 腾讯面试题:给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?
- 腾讯面试题:给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?
- 给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?
- 腾讯面试题:给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?
- 面试题:给40亿个不重复的无符号整数,没排过序,给一个无符号整数如何快速判断这个数是否在这40亿个数中
- 给40亿个不重复的无符号整数,没排过序。给一个无符号整数,如何快速判断一个数是否在这40亿个数中。 【腾讯】
- 面试题--给40亿个不重复的,没有排过序,给一个无符号整数,如何判断这个数在这40亿个数中
- 运用bitmap解决一道海量数据处理面试题:在2.5亿个整数中找出不重复的整数,注,内存不足以容纳这2.5亿个整数。
- 浮点数在intel上的二进制存储结构,以及如何判断一个浮点数是否为整数
- 浮点数在intel上的二进制存储结构,以及如何判断一个浮点数是否为整数
- Bitmap在海量无重复整数排序时的应用
- [海量数据处理]用2-Bitmap找出数组中不重复的整数
- 156 含n个元素的整数数组至少存在一个重复数,在 O(n)时间内找出其中任意一个重复数
- 一个含n个元素的整数数组至少存在一个重复数, 请编程实现,在O(n)时间内找出其中任意一个重复数。
- 对于一个SIZE大小的数组,元素是[0,SIZE-1]区间内的整数,判断其中是否有重复元素
- 网络基本功(二十):细说ICMP和ARP
- Nginx配置SSL证书部署HTTPS网站
- 网络基本功(二十一):细说HTTP(上)
- 自动寻路Navmesh基础入门
- POJ 题目 Road Construction(双连通)
- 题目:海量数据处理,40亿个不重复的unsigned int的整数,如何判断某数是否在其中?
- 网络基本功(二十二):细说HTTP(下)
- 83. Remove Duplicates from Sorted List
- c++之const
- 网络基本功(二十三):Wireshark抓包实例诊断TCP连接问题
- C++文件数据插入
- Win32编程之WinMain
- 黑马程序员————oc内存管理
- SQL 基础:Select语句,各种join,union用法