mapreduce 二次排序

来源:互联网 发布:mac文字游戏制作软件 编辑:程序博客网 时间:2024/06/05 14:10

mapreduce 二次排序

需求

对用户的访问(点击和浏览)进行排序和归类

思路

通过mapreduce计算,并将结果写入hive ORC 外表

项目解析

项目结构

GuIdDatePair

GuIdPartitioner

PathComputeDriver

PathMapper

PathGroupingComparator

PathReducer

TextArrayWritable

项目地址

https://github.com/vickyi/VisitPath

原创粉丝点击