程序博客网 > 网络借贷存管指引

Map/Reduce爬虫

来源：互联网发布：网络借贷存管指引编辑：程序博客网时间：2024/06/15 13:58

input -> map -> shuffle -> reduce -> output

input时先把文件变成<行偏移量，此行的文字>
map函数将input的结果进行处理，变成<K,V>的形式，然后Sort
然后通过Shuffle在当前节点将相同的Key的Value合并(merge)，变成<K,[V1,V2,V3····]>
然后传到Reducer节点进行reduce处理

因为从Mapper节点向Reducer节点传输消耗网络带宽，所以要尽可能在Mapper上把能处理的数据尽情处理，不需要的数据丢掉。这样在向Reducer上copy时就可以尽可能的节省带宽。map，shuffle都在map节点进行，reduce在另外的reduce上节点进行。

0 0

网络借贷存管指引

网络借贷存管指引

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子肛周脓肿的主诉带状疱疹主诉怎么写慢阻肺的主诉尿路感染主诉面神经炎主诉包皮过长主诉大隐静脉曲张主诉一过性脑缺血发作的主诉主耶稣基督祷告词大全主啊我亏欠了你歌谱词谱主将从现的标志词某主神的远征离人词客老经老晨主持主讲台词老经老晨主持主讲台词整理版主语从句主语主语是什么形式主语主语补足语逻辑主语英语主语什么是主语主语+谓语主语城主语谓语宾语主语谓语宾语定语状语补语动名词做主语主语从句例句主语从句讲解不定式做主语主语从句引导词 it做形式主语 that引导的主语从句 it作形式主语常见句型 sat逻辑主语题不定式作主语动词做主语用什么形式主语从句和定语从句的区别动名词做主语谓语动词用单数主语从句例句20个主语从句的引导词