<spark> 集群下運行範例紀錄
来源:互联网 发布:添加URL端口 编辑:程序博客网 时间:2024/06/16 15:58
# 查看任一日志總條數import findsparkfindspark.init()from pyspark import SparkContext,SparkConfconf=SparkConf()conf.setMaster("spark://172.XX.XX.XX:7077")conf.setAppName("test-count")sc = SparkContext(conf=conf)file3 = "hdfs://172.XX.XX.XX:9000/opt/hadoop-2.6.3/test/world20716.bi"line3 = sc.textFile(file3)print(line3.count())
#參考的例子from pyspark import SparkContext,SparkConfconf=SparkConf()conf.setMaster("spark://192.168.2.241:7077")conf.setAppName("test application")logFile="hdfs://hadoop241:8020/user/root/testfile"sc=SparkContext(conf=conf)logData=sc.textFile(logFile).cache()numAs=logData.filter(lambda s: 'a' in s).count()numBs=logData.filter(lambda s: 'b' in s).count()print "Lines with a:%i,lines with b:%i" % (numAs,numBs)
0 0
- <spark> 集群下運行範例紀錄
- spark集群
- spark 集群
- spark集群
- spark集群
- spark配置:spark集群
- Hadoop集群安装spark集群
- Spark集群安装
- spark集群安装
- Spark集群部署
- Spark集群部署
- spark集群管理简述
- Spark集群配置
- Spark集群安装
- Spark集群术语
- 搭建spark-hadoop集群
- 构建Spark集群
- Spark集群部署
- Windows下通过命令行编译C/C++程序
- 【zzuliOJ】1901 - 985的SS串难题(字典树 & dfs)
- volley简介
- list 取第几个元素
- HADOOP的本地库(NATIVE LIBRARIES)介绍
- <spark> 集群下運行範例紀錄
- list的相关操作 - 单词倒排 - 统计个数
- HDU-5793-A Boring Question-打表找规律加模逆元
- POJ3267——The Cow Lexicon
- 205.leetcode Isomorphic Strings (easy)[map结构 字符串处理]
- 请问在两个程序之间如何通信?
- Django 模板里赋值
- 【Android】【优化】
- poj 3267 The Cow Lexicon