程序博客网 > p2p网贷平台软件

Hive中小表与大表关联(join)的性能分析

来源：互联网发布：p2p网贷平台软件编辑：程序博客网时间：2024/06/06 14:28

http://blog.csdn.net/wisgood/article/details/17739177

这篇文章分析的很详细，配上了例子

得出的结果：

假设A.id=B.id,A表id=3的有N条，B表id=3的有M条，两个表关联时，reduce会处理id相同的记录，那reduce时比较的次数：

N*（1+M）

该公式可以验证博文中提到的各种例子，也可以证明为什么要把参与join的key（此处为id）重复记录较少的表放前面的原因，因为N++，或导致1+M次的增加。

补充的说法，跟join无关的、A、B表中不存在重复的key，都不会影响join的性能，所以不能简单的认为“把小表放前面”就能提高性能

比如A表中有一条记录id=4，而B表中没有id=4的记录，那不管A表中id=4的记录有多少条，都不会影响join性能

0 0

p2p网贷平台软件

p2p网贷平台软件

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子网上挂号爽约怎么办预约挂号被拉黑怎么办小儿湿疹怎么办岑溪怎么办职称人流不全怎么办药流后同房了怎么办第一次就怀孕怎么办怀孕宫颈炎流血怎么办早期孕期头疼怎么办不想要宝宝怎么办低钾血症的原因怎么办宝宝身体湿疹怎么办湿疹该怎么办宝宝身上湿疹怎么办做手术查出梅毒怎么办小孩子不吃青菜怎么办吃鸡蛋糕房怎么办人工流产后腰酸怎么办人工流产后腰疼怎么办人流腰痛怎么办流产腰酸背痛怎么办流产腰疼怎么办月子没坐好腰疼怎么办打胎后腰疼怎么办打胎后腰酸怎么办自然流产大出血怎么办小产后腰酸怎么办流产后腰酸怎么办动物检疫证明怎么办人工授精准生证怎么办成都准生证怎么办 207 江西省准生证怎么办网上怎么办准生证办完准生证以后怎么办农村准生证怎么办2017 墙面瓷砖不喜欢怎么办卫生间瓷砖滑怎么办瓷砖颜色不喜欢怎么办地板砖潮湿怎么办冬天地板砖凉怎么办地板砖有划痕怎么办