三千记之知识备忘
来源:互联网 发布:java 线程安全的list 编辑:程序博客网 时间:2024/04/29 06:52
1、hive 中 group by 优化 count(distinct) 文章:
== 当时用distinct的时候,mapreduce会把所有的数据都shuffle到一个reduce上面,使用group by的话,会把数据分散到reduce上:
[1] http://blog.csdn.net/wisgood/article/details/18040363
[2] http://blog.csdn.net/xiaoshunzi111/article/details/68484426
2、shuffle的过程及作用:
[1]
[2]
3、hashmap的数据结构及原理:
== 是由数组+链表组成的哈希表,为的是数据查找方便,同时又不用那么多的存储空间。
[1] http://blog.csdn.net/vking_wang/article/details/14166593
4、kafka的分区与broker问题:
== 是。
[1] http://blog.csdn.net/vking_wang/article/details/14166593
阅读全文
0 0
- 三千记之知识备忘
- 三千记之知识备忘
- 三千记之数据结构
- 三千记之实践应用
- 若水三千,只取一瓢饮之
- 卡勒沃夫之弱水路三千
- 要你命三千又三千的成长之旅
- 要你命三千又三千的成长之旅
- 备忘知识
- Android倚天剑之Notification之城管三千
- 卡勒沃夫之弱水路三千1
- BAT相关知识备忘
- asp备忘知识
- Linux知识备忘
- Linux知识备忘
- 备忘的小知识
- SMB知识备忘
- DSP零碎知识备忘
- Python list,Dict和Set
- MTCNN中将自己训练的o-net接在作者提供的net1,net2后面python代码解读
- POJ 3463 Sightseeing(最短路次短路计数)
- JDK对国际化的支持
- 休整之后
- 三千记之知识备忘
- 引用与对象之Iterator中添加数据忘记new对象的错误
- crontab条目包含%号问题
- Spring Cloud Sleuth与Zipkin整合时遇到的问题记录
- 由浅至深学习block
- attribute value must be constant
- Git学习(GitHug安装及其闯关攻略)
- http协议笔记
- Swift3中数组创建方法