maven3.5+hadoop2.7.3统计米骑测试日志KPI指标(四)
来源:互联网 发布:java switch 例子 编辑:程序博客网 时间:2024/05/20 18:51
下面统计下访问次数最高的ip.
(1)主要通过比较每个ip的次数,然后保留次数大的,最后输出次数最大的.比较完后,用cleanup清除资源.
public class Kpi_IP_TopCount {public static class TopMapper extends Mapper<Object, Text, LongWritable, NullWritable> {long max = Long.MIN_VALUE;public void map(Object key, Text value, Context context) throws IOException, InterruptedException {if(value.toString().indexOf("\\")==-1){// split String line = value.toString(); String[] fields = line.split("\t"); long temp = Long.parseLong(fields[1]); if(temp>max) max = temp;}}protected void cleanup(Context context) throws java.io.IOException ,InterruptedException {context.write(new LongWritable(max), NullWritable.get());}}public static class TopReducer extends Reducer<LongWritable, NullWritable, LongWritable, NullWritable> {long max = Long.MIN_VALUE;public void reduce(LongWritable key, Iterable<NullWritable> values, Context context)throws IOException, InterruptedException {long temp = key.get();if(temp>max){max = temp;}}protected void cleanup(Context context) throws java.io.IOException ,InterruptedException {context.write(new LongWritable(max), NullWritable.get());}}public static void main(String[] args) throws Exception {Configuration conf = new Configuration();Job job = new Job(conf, "ip count topCount");job.setJarByClass(Kpi_IP_TopCount.class);job.setMapperClass(TopMapper.class);//job.setMapOutputKeyClass(LongWritable.class);//job.setMapOutputValueClass(NullWritable.class);//job.setCombinerClass(TopReducer.class);job.setReducerClass(TopReducer.class);job.setOutputKeyClass(LongWritable.class);job.setOutputValueClass(NullWritable.class);FileInputFormat.addInputPath(job, new Path("hdfs://119.29.174.43:9000/user/hadoop/kpi_ip_log_Input"));FileOutputFormat.setOutputPath(job, new Path("hdfs://119.29.174.43:9000/user/hadoop/kpi_ip_log_OutTopCount"));System.exit(job.waitForCompletion(true) ? 0 : 1);}}
阅读全文
0 0
- maven3.5+hadoop2.7.3统计米骑测试日志KPI指标(四)
- maven3.5+hadoop2.7.3统计米骑测试日志KPI指标(一)
- maven3.5+hadoop2.7.3统计米骑测试日志KPI指标(二)
- maven3.5+hadoop2.7.3统计米骑测试日志KPI指标(三)
- 海量Web日志分析 用Hadoop提取KPI统计指标
- 海量Web日志分析 用Hadoop提取KPI统计指标
- 海量Web日志分析 用Hadoop提取KPI统计指标
- 海量Web日志分析 用Hadoop提取KPI统计指标
- 海量Web日志分析 用Hadoop提取KPI统计指标
- 海量Web日志分析 用Hadoop提取KPI统计指标
- 海量Web日志分析 用Hadoop提取KPI统计指标
- 海量Web日志分析 用Hadoop提取KPI统计指标
- 海量Web日志分析 用Hadoop提取KPI统计指标
- 测试部门KPI考核指标(绩效考核)
- 大数据Web日志分析 用Hadoop统计KPI指标实例
- 大数据Web日志分析 用Hadoop统计KPI指标实例
- Hadoop Mapreduce Kpi 用Hadoop提取KPI统计指标
- hive1.2.2+hadoop2.7.3导入米骑测试日志以及数据优化(五)
- PHP 7中新的Hashtable实现和性能改进
- js使用rsa加密大数据块的java实现
- 使用mybatis在mysql中进行like查询遇到的问题
- 美团CODEM 字串
- java调用天气预报的webservice
- maven3.5+hadoop2.7.3统计米骑测试日志KPI指标(四)
- 创建爬虫----导航树
- git相关操作
- 进程——孤儿进程与僵尸进程
- Linux调整LVM容量
- hdu 3718 二分图最佳匹配 占坑待补
- 查询与增改删功能
- ScriptManager的几个属性和方法
- Postman使用