关于pyspark 使用过程中需要python版本不同的需求
来源:互联网 发布:昆士兰大学软件专业 编辑:程序博客网 时间:2024/05/18 00:54
最近碰到了一个问题,挺有意思,是在使用spark过程中需要用到pyspark,而本地接口机的python版本太低,只有python 2.6版本,需求需要python 2.7版本甚至python 3版本。
但是在使用过程中不允许修改主机自带的python。
怎么办呢。只能手动下载指定。其中又分为 anaconda 版本的python,还有直接python官网下载python包安装。
其中anaconda又分为 parcel 版的,还有.sh安装版本。
首先说一下使用python 官网下载python包安装的方式。
下载地址:
https://www.python.org/download/releases/2.7/
然后安装这个python
tar xzvf Python-2.7.tgzcd Python-2.7./configure --prefix=/opt/pythonmakesudo make install
之后就是需要在运行spark程序的时候指定了:
spark的deploy-mode一般有两种模式,一个是cluster 模式,一个是client模式
其中client模式需要设置:
PYSPARK_PYTHON=/path/to/python2.7 (可在环境变量中设置,可以在spark-env.sh中设置)
cluster模式需要设置:
spark.yarn.appMasterEnv.PYSPARK_PYTHON=/path/to/python2.7
spark.yarn.appMasterEnv.PYSPARK_DRIVER_PYTHON=/path/to/python2.7 (可在运行中临时指定,也可在spark-default.sh中设置)
然后再说一下anaconda版本的python。。这是一个大坑。。奈何做科学计算还有好多人认这个工具。。总是令人不忍放弃,却又心力憔悴。
一开始用anaconda版本的.sh文件安装的。奈何提交clinet模式的时候总是报
Exception in thread "main" java.io.IOException: Cannot run program "/home/hadoop/Anaconda/bin": error=13, Permission denied
搞了将近一个月,最终还是不行,除非用root用户,或者sudo运行,否则无法正常提交,但是这肯定是不行的
最后使用了cloudera manager 集成了anaconda 的parcel,然后拷贝了这个被集成之后的目录到客户端使用才解决了这个问题
/opt/cloudera/parcels/Anaconda/bin
其他的参数配置跟上面的相同。就是这些:
其中client模式需要设置:
PYSPARK_PYTHON=/path/to/python2.7 (可在环境变量中设置,可以在spark-env.sh中设置)
cluster模式需要设置:
spark.yarn.appMasterEnv.PYSPARK_PYTHON=/path/to/python2.7
spark.yarn.appMasterEnv.PYSPARK_DRIVER_PYTHON=/path/to/python2.7 (可在运行中临时指定,也可在spark-default.sh中设置)
- 关于pyspark 使用过程中需要python版本不同的需求
- 关于在anaconda中切换不同的python版本
- 关于不同的编译器使用过程中遇到的问题!
- pyspark中使用自定义模块的问题
- 关于android版本升级迭代过程中需要注意的问题
- Spark 使用Python在pyspark中运行简单wordcount
- pyspark notebook的使用
- [python]如何使用virtualenvwrapper切换 不同版本的python?
- [python]如何使用virtualenvwrapper切换不同版本的python?
- Python-pyspark中常见问题总结
- 关于在一套复制环境中使用不同版本OGG的问题
- 关于在一套复制环境中使用不同版本OGG的问题
- 关于在一套复制环境中使用不同版本OGG的问题.
- pyspark使用指定python环境后的提交方法
- 不同python版本在使用pyserial的一些使用区别
- 使用ant将一份源码编译出不同需求的版本
- 如何在一个机器上针对不同的项目需求使用不同的pyhon版本和包
- Ubuntu 中Python不同版本切换的简便方法
- 【重大更新】DevExpress v17.2新版亮点—WPF篇(三)
- Linux系统Apache2.4+Tomcat8.5整合配置
- MySQL数据库无法连接的问题解决方案
- lwj_C#_集合list<T>
- Poj Jungle Road (优先队列Prim算法) 解题报告
- 关于pyspark 使用过程中需要python版本不同的需求
- 天池新人实战赛o2o优惠券使用预测一
- SSH框架整合
- 前端开发规范:命名规范、html规范、css规范、js规范
- spring 实现定时任务demo
- 人物IK设置(改变左右手角度实现拿东西效果)
- 练习:关于通讯录管理系统
- 人工智能工程师学习路线及具备的5项基本技能
- 61. Rotate List