spark+java1.8+lamda wordCount 实例,并且实现按单词出现的次数的倒序排序
来源:互联网 发布:开淘宝店要营业执照吗 编辑:程序博客网 时间:2024/06/06 08:56
package com.jiangzeyun.spark.core;import java.util.Arrays;import org.apache.spark.SparkConf;import org.apache.spark.api.java.JavaPairRDD;import org.apache.spark.api.java.JavaRDD;import org.apache.spark.api.java.JavaSparkContext;import scala.Tuple2;/** * * @author jiangzeyun * @brief WordCount 第一个spark程序 * */public class WordCount {public static void main(String[] args) {//本地模式SparkConf conf = new SparkConf().setAppName("WordCount").setMaster("local");@SuppressWarnings("resource")JavaSparkContext sc = new JavaSparkContext(conf);JavaRDD<String> lines = sc.textFile("/usr/local/hadoop/README.txt");JavaRDD<String> words = lines.flatMap( s -> Arrays.asList(s.split(" ")).iterator()); JavaPairRDD<String, Integer> pairs = words.mapToPair(s -> new Tuple2<String, Integer>(s, 1));JavaPairRDD<String, Integer> counts = pairs.reduceByKey((a, b) -> a + b);//如果要实现按单词出现的次数从高低排名,1,首先要tuple的key value值,然后再按key排序,然后再交换过来JavaPairRDD<Integer, String> tmp = counts.mapToPair(s->new Tuple2<Integer, String>(s._2,s._1)).sortByKey(false);JavaPairRDD<String, Integer> result = tmp.mapToPair(s->new Tuple2<String, Integer>(s._2,s._1));result.foreach(a -> System.out.println(a._1+"=>"+a._2()));sc.stop();}}
0 0
- spark+java1.8+lamda wordCount 实例,并且实现按单词出现的次数的倒序排序
- Spark Streaming实现实时WordCount,DStream的使用,updateStateByKey(func)实现累计计算单词出现频率
- 单词的出现次数
- 统计单词出现的次数并按单词出现的次数顺序输出单词及其次数
- 统计一篇英文文件中,单词出现的次数,并按单词的长度进行排序
- Spark primer 之wordcount 剖析(添加 spark按照单词出现次数排名)
- Hadoop实现单词出现次数排序
- java8实现spark wordcount并且按照value排序输出
- Spark实现WordCount单词计数
- java实现读取一篇英文文章,统计其中每个单词出现的次数并排序输出
- 统计每行的单词出现次数并排序
- 通过awk对文本文件的单词出现次数进行排序
- 统计单词出现的次数
- baidu单词出现的次数
- 统计单词出现的次数
- 统计单词出现的次数
- 统计单词出现的次数。
- List列表实现统计文档中单词出现的次数
- [Leetcode] Two Sum II - Input array is sorted
- 互联网读书-视界互联网+时代的创新与创业
- 产生死锁的原因和必要条件 解决死锁的基本方法
- C++ fstream cannot create file (无法创建文件)
- C++中模板的使用示例
- spark+java1.8+lamda wordCount 实例,并且实现按单词出现的次数的倒序排序
- POJ 2914 Minimum Cut 全局最小割
- Leetcode 105. Construct Binary Tree from Preorder and Inorder Traversal 先序和中序中恢复二叉树 解题报告
- light oj 1212 - Double Ended Queue (双向队列)
- Codeforces Round #347 (Div. 1) E. Binary Table ★ ★ ★
- UVA10054The Necklace
- sed命令用法
- 写一个简单String类
- 第三周 项目一-顺序表的基本运算(1)