spark python wordcount
来源:互联网 发布:黄金现货交易软件 编辑:程序博客网 时间:2024/05/24 06:15
#!/usr/bin/python# -*- coding: UTF-8 -*-'''初始化SparkConf, SparkContext从pyspark 导入SparkConf, SparkContext'''from pyspark import SparkConf, SparkContextconf = SparkConf().setMaster("local").setAppName("My App")sc = SparkContext(conf = conf)inputFile = "hdfs://192.168.10.101:9000/input/test.txt"outputFile = "hdfs://192.168.10.101:9000/output"#读取我们的输入数据input = sc.textFile(inputFile)# 把它切分成一个个单词words = input.flatMap(lambda line: line.split(" "))#转换为键值对并计数counts = words.map(lambda word: (word, 1)).reduceByKey(lambda a, b: a + b)#将统计出来的单词总数存入一个文本文件,引发求值counts.repartition(1).saveAsTextFile(outputFile)SparkContext.stop()
阅读全文
0 0
- spark python wordcount
- Spark wordcount - Python, Scala, Java
- Spark下使用python写wordCount
- spark-wordcount
- Spark-wordcount
- wordcount spark...
- wordCount spark
- spark wordcount
- Spark WordCount
- spark wordcount
- Spark WordCount
- spark wordcount
- spark wordcount
- Spark 使用Python在pyspark中运行简单wordcount
- Python开发Spark应用之Wordcount词频统计
- Spark及HDFS环境下使用python的wordcount实例
- python、scala、java分别实现在spark上实现WordCount
- python wordcount
- 在ubantu下尝试WxPython
- JAVA课程设计——华容道小游戏
- BIOS-SMI Introduction
- Bootstrap模态框相关的问题
- Java之HashMap源码解读
- spark python wordcount
- 数据结构-图的基础代码
- tp5中使用phpexcel生成表格
- ROS YOLOv2
- K、KB、M、MB、G、GB 、TB
- 进制转换
- C语言mooc小程序(1)
- 在github创建项目,以及pull到本地
- [HNOI2012]永无乡 SBT+启发式合并