程序博客网 > 一千零一夜淘宝出品

Hadoop中MapReduce的实现方式还是不明白啊。

来源：互联网发布：一千零一夜淘宝出品编辑：程序博客网时间：2024/06/05 06:47

今天阅读了zhangqinghao9203专栏中的2篇文章：

海量Web日志分析用Hadoop提取KPI统计指标
用Hadoop构建电影推荐系统

但是，对于MapReduce核心调用的代码还是不明觉利，特别是对于OutputCollector,Iterator,Reporter在分布式环境中的用法和行为模式还是不甚明了。看来，我还是需要找一些Hadoop的算法原理性的文章研究研究。

public void map(Object key, Text value, OutputCollector output, Reporter reporter) throws IOException

{

KPI kpi = KPI.filterPVs(value.toString());

if (kpi.isValid()) { word.set(kpi.getRequest()); output.collect(word, one); }

}

public void reduce(Text key, Iterator values, OutputCollector output, Reporter reporter) throws IOException

{

int sum = 0;

while (values.hasNext()) { sum += values.next().get(); }

result.set(sum);

output.collect(key, result);

}

虽然，没完全看懂，但是对MapReduce还是有了新的认识。算是一点点小收获吧。

0 0

一千零一夜淘宝出品

一千零一夜淘宝出品

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子汉中景点汉中到北京汉中建材汉中做生意汉中飞西安重庆到汉中汉中彭立峰汉中里汉中旅游景点汉中旅游景点大全汉中职业技术学院西安到汉中高铁汉中旅游攻略陕西汉中旅游汉中龙头山门票价格多少2019 汉中市中心医院汉中属于哪个省汉中到西安高铁汉中龙头山门票汉中景点排行榜西安到汉中多少公里汉中旅游攻略自驾游汉中龙头山森林公园汉中好玩的地方汉中芦苇荡湿地公园陕西汉中旅游景点大全汉中哪里好玩汉中周边好玩的地方汉中周边自驾游汉中旅游景点排名汉中是哪个省的汉中有什么好玩的地方汉中博物馆旅游汉中师范学院陕西省汉中市汉中人事考试网汉中是哪个省的城市汉中是几线城市汉中美食排行榜汉中离西安多远汉中小吃一条街