三千记之知识备忘

来源：互联网发布：java 线程安全的list 编辑：程序博客网时间：2024/04/29 06:52

1、hive 中 group by 优化 count(distinct) 文章：
== 当时用distinct的时候，mapreduce会把所有的数据都shuffle到一个reduce上面，使用group by的话，会把数据分散到reduce上：
[1] http://blog.csdn.net/wisgood/article/details/18040363
[2] http://blog.csdn.net/xiaoshunzi111/article/details/68484426

2、shuffle的过程及作用：
[1]
[2]

3、hashmap的数据结构及原理：
== 是由数组+链表组成的哈希表，为的是数据查找方便，同时又不用那么多的存储空间。
[1] http://blog.csdn.net/vking_wang/article/details/14166593

4、kafka的分区与broker问题：
== 是。
[1] http://blog.csdn.net/vking_wang/article/details/14166593

阅读全文

0 0

三千记之知识备忘
三千记之知识备忘
三千记之数据结构
三千记之实践应用
若水三千,只取一瓢饮之
卡勒沃夫之弱水路三千
要你命三千又三千的成长之旅
要你命三千又三千的成长之旅
备忘知识
Android倚天剑之Notification之城管三千
卡勒沃夫之弱水路三千1
BAT相关知识备忘
asp备忘知识
Linux知识备忘
Linux知识备忘
备忘的小知识
SMB知识备忘
DSP零碎知识备忘
Python list，Dict和Set
MTCNN中将自己训练的o-net接在作者提供的net1,net2后面python代码解读
POJ 3463 Sightseeing（最短路次短路计数）
JDK对国际化的支持
休整之后
三千记之知识备忘
引用与对象之Iterator中添加数据忘记new对象的错误
crontab条目包含%号问题
Spring Cloud Sleuth与Zipkin整合时遇到的问题记录
由浅至深学习block
attribute value must be constant
Git学习(GitHug安装及其闯关攻略)
http协议笔记
Swift3中数组创建方法