文章标题

来源:互联网 发布:鞭炮专卖 知乎 编辑:程序博客网 时间:2024/06/13 12:18

/*
*猎豹移动面试总结
*/
1、第一面
做过最熟悉的项目,数据处理怎么做的?
算法题:有一堆乒乓球,分别放到4个桶里,他们最终的比例是1:2:3:4,如何实现?
这个题考官提示用随机产生器,分别产生概率为,0.1,0.2,0.3.0.4,根据概率放到不同的4个桶里,最终满足要求。
2、第二面
简单介绍一下,基于用户的协同过滤,怎么实现的,实现过程中遇到什么问题?
scala有没有接触过
spark比hadoop好在哪里?
hadoop如何实现全排序?
linux里面管道查询,查询pid为334的进程
linux里面的哪个命令能够实现和查看windows任务管理器进程信息的一样的效果?
答案整理:
hadoop如何实现全排序?
这个难点就在MapReduce的shuffle阶段,关键在如何取样和怎么写Partitioner。

spark比hadoop好在哪里?