【面试题】海量数据 无符号整型

来源:互联网 发布:域名模板名称怎么填 编辑:程序博客网 时间:2024/05/17 23:52

题:10亿个32位的无符号整数,里面有少量重复的,用最快的方法找出重复的数。

 

当时对数据不太敏感,认为一般的内存无法保存2^32位,后来突然想起来2^32位只需要战用256M的内存。解法如下:

分配一个2^32bit的位数组,32位的无符号数的按大小正好装入这个位数组中,初始化数组全0,扫描10亿个数据,检查其对应的位是否为1,如果为1则是重复的,如果为0,将其置1,继续扫描下一个数。

此解法为《编程珠玑》里的经典解法,

 

如果前提改为10亿个字符串用什么方法,还没想出来。