在notebook中使用pyspark遇到的问题
来源:互联网 发布:javascript 输入 赋值 编辑:程序博客网 时间:2024/06/04 18:18
代码:
from pyspark import SparkContextsc = SparkContext()rdd.getNumPartitions()rdd.glom().collect()
遇到的问题:
执行rdd.glom().collect()时出现如下错误:
Py4JJavaError: An error occurred while calling z:org.apache.spark.api.python.PythonRDD.collectAndServe.: org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 0.0 failed 1 times, most recent failure: Lost task 0.0 in stage 0.0 (TID 0, localhost, executor driver): org.apache.spark.api.python.PythonException: Traceback (most recent call last): File "/usr/local/spark/python/lib/pyspark.zip/pyspark/worker.py", line 123, in main ("%d.%d" % sys.version_info[:2], version))Exception: Python in worker has different version 3.6 than that in driver 2.7, PySpark cannot run with different minor versions.Please check environment variables PYSPARK_PYTHON and PYSPARK_DRIVER_PYTHON are correctly set
解决办法:
在集群上的每个节点上添加环境变量
export PYSPARK_DRIVER_PYTHON=/usr/local/anacond/bin/python3
export PYSPARK_PYTHON=/usr/local/anacond/bin/python3
记得使用source命令生效,然后重启集群中的所有节点,重启spark
阅读全文
0 0
- 在notebook中使用pyspark遇到的问题
- pyspark notebook的使用
- 在win7下配置pyspark在jupyter notebook中使用的简单方法
- pyspark 遇到的问题
- pyspark notebook中文显示问题的解决
- pyspark 经常遇到的问题
- pyspark中使用自定义模块的问题
- 在pyspark上配置ipython notebook
- 在使用PowerDesigner中遇到的问题
- EXTJS在使用中遇到的问题
- 在使用DrawerLayout中遇到的问题
- 关于在windows平台下使用ipython运行pyspark的问题
- 关于在windows平台下使用ipython运行pyspark的问题
- 如何在windows下安装配置pyspark notebook
- 在Mac上使用Jupyter Notebook遇到打不开浏览器的情况
- pyspark调用jupyter notebook
- 在ipython notebook中使用argparse
- 如何在Jupyter Notebook中使用Tensorflow
- angular简单随机选择
- Java设计模式之享元模式
- Android Activity探究活动
- PageRank算法 到 textRank
- 【考研】第十四周总结
- 在notebook中使用pyspark遇到的问题
- 有趣的理解面向对象之封装!
- 史上最简单的 MySQL 教程(四十)「数据库变量」
- 使用Tomcat实现Java连接池(解决main中不能够调用问题)
- TCP三次握手&四次分手抓包分析
- JS的闭包
- 点击RecyclerView的条目跳转
- 后缀数组
- angular简单密码判断