hadoop的一些基本问题
来源:互联网 发布:网络歌手樊棋照片 编辑:程序博客网 时间:2024/05/16 14:50
1给定a,b 二个文件,各存放50亿各url每个url各存64个字节,内存限制是4g,找出a,b文件共同的url
哈希表
2有1亿个数,随机分布,求前一千个最大的数,内存限制为100兆
分块
3有2.5亿个正整数中找出不重复的整数。内存2.5g
为每个整数设置标志位,有2位组成
00 01 10 11
分别表示没出现过,出现过1次,出现过多次,不考虑
分别遍历这些整数
4有40亿个邮件地址,没排过序,然后再给一个邮件地址,如何判断这个地址在不在这40亿个邮件地址之中
哈希表
5海量数据分布在100台电脑中,想办法高效的统计出这批数据的top10
0 0
- hadoop的一些基本问题
- hadoop的一些基本用法
- hadoop遇到的一些问题
- Hadoop、spark的一些基本使用笔记
- Hadoop的一些基本介绍 jps
- C++的一些基本问题
- 程序设计的一些基本问题
- java的一些基本问题
- 堆的一些基本问题
- 概率论的一些基本问题
- 学习Hadoop中遇到的一些问题
- 最近跑hadoop遇到的一些问题
- hadoop配置遇到的一些问题
- Hadoop启动时的一些问题
- hadoop中遇到的一些问题
- win7开发hadoop的一些问题
- hadoop环境搭建hbase的一些问题
- Mac配置Hadoop遇到的一些问题
- C/C++头文件
- JWT/JJWT JSON WEB TOKEN介绍和使用
- Python爬虫利器二之Beautiful Soup的用法
- ActivityMQ中几种常用通讯方式
- PS_BaseUse_人像照片瑕疵处理
- hadoop的一些基本问题
- QCommandLine
- NUC郭姐的老婆
- java知识图谱
- Html 5新特性
- 【bzoj2190】[SDOI2008]仪仗队
- 开发中资料速查整理.持续更新.....
- HDU1237 简单计算器【堆栈】
- DE1-SoC初学者——PL部分编程实录——简单LED——连载01(图片上传失败,重新做图中...)