使用Python连接spark程序测试
来源:互联网 发布:汇编语言vb和c语言区别 编辑:程序博客网 时间:2024/06/03 18:07
from pyspark import SparkContext
logFile = "/user/spark/text.dat"
sc = SparkContext("local", "Simple App")
logData = sc.textFile(logFile).cache()
numAs = logData.filter(lambda s: 'a' in s).count()
numBs = logData.filter(lambda s: 'b' in s).count()
print("Lines with a: %i, lines with b: %i" % (numAs, numBs))
问题1:"No module named pyspark".
问题2: No module named py4j.java_gateway
logFile = "/user/spark/text.dat"
sc = SparkContext("local", "Simple App")
logData = sc.textFile(logFile).cache()
numAs = logData.filter(lambda s: 'a' in s).count()
numBs = logData.filter(lambda s: 'b' in s).count()
print("Lines with a: %i, lines with b: %i" % (numAs, numBs))
问题1:"No module named pyspark".
问题2: No module named py4j.java_gateway
解决方法:在环境变量里加入export PYTHONPATH=$SPARK_HOME/python:$SPARK_HOME/python/build:$PYTHONPATH
0 0
- 使用Python连接spark程序测试
- spark与kafka连接测试
- Spark实战----(1)使用Scala开发本地测试的Spark WordCount程序
- spark sql 测试小程序
- scala/spark/python使用
- HSqlDB连接测试程序
- mysql连接测试程序
- spark下跑python程序
- zeppelin 安装使用,测试spark,spark sql
- tableau桌面版连接spark sql的测试
- spark on yarn 出现的问题【测试wordcount程序遇到的错误,ipc.client连接到yarn的端口失败】
- spark入门实战windows本地测试程序
- spark连接mysql数据库(python语言)
- 使用IDEA运行Spark程序
- 使用IDEA开发spark程序
- 使用Idea提交Spark程序
- redis连接测试程序出错
- Windows 上面搭建 Spark + Pycharm/idea scala/python 本地编写Spark程序,测试通过后再提交到Linux集群上
- 直播间架构设计
- android 开发中的文件操作
- java如何获取当前时间的方法汇总
- Android开源项目
- (学习笔记)ContentProvider
- 使用Python连接spark程序测试
- 虚拟机操作---JDK与Hadoop的安装
- android开发之 Gson 解析json数组
- 当数据加载完停止ion-infinite-scroll
- AOP
- scrollview和listview共存
- C#语音SDKSDK接口开发经验及具体开发实现
- Show full directory path in MAC
- 使用第三方的短信验证码