程序博客网 > mac 维修

Spark的使用方法（二）

来源：互联网发布：mac 维修编辑：程序博客网时间：2024/05/18 00:58

Spark使用过程中报错汇总

报错1： “ValueError: Cannot run multiple SparkContexts at once; existing SparkContext(app=PySparkShell, master=local[*]) ”
原因：出现这个错误是因为之前已经启动了SparkContext
解决方法：查看代码，看是否有多次运行SparkContext实例；也可以先关闭spark（sc.stop() // 关闭spark ），然后再启动。
报错2： “AttributeError: ‘PipelinedRDD’ object has no attribute ‘toDF’”
原因：toDF()是运行在Sparksession（1.X版本的Spark中为SQLContext）内部的一个补丁，如果有其他函数用到toDF()，那么需要先创建SparkSession（）。
解决方法：以IndexedRow()为例，当利用IndexedRow（）产生RDD时，需要

sc=SparkContext()SparkSession(sc)#利用SparkSession来使sc具有处理PipelinedRDD的能力indexedRows = sc.parallelize([IndexedRow(0, [1, 2, 3]),IndexedRow(1, [4, 5, 6]),IndexedRow(2, [7, 8, 9]),IndexedRow(3, [10, 11, 12])])

阅读全文

0 0

mac 维修

mac 维修

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子 2019各省gdp总量排名世界经济总量排名2018 大湾区经济总量中国经济总量世界排名中国经济总量 2019世界gdp总量排名中国2018gdp总量台湾经济总量在中国排名2018 我国人口总量平稳增长 2019年gdp总量贵州省人口总量我国水资源总量工作总量的公式中美gdp总量对比2018 2018世界经济总量排名 2018年各省gdp总量排名 2018年我国gdp总量 2018年中国gdp总量 2018各省经济总量排名 2019各省经济总量排名美国2018年gdp总量中国2018年gdp总量 2017年大湾区经济总量 2017年大湾区经济总量约多少元 2017大湾区经济总量乐山大佛实行游客总量控制9 乐山大佛实行游客总量控制l 2018年广西各市gdp总量排名 2019年广西各市gdp总量排名 2019年各省经济总量排名 2019年全国省份经济总量排名 2018年中国各省台湾gdp总量排名 2019年湖北省各地经济总量排名穿成霸总亲闺女银楼穿成霸总亲闺女银楼格格党穿成霸总亲闺女银楼工银总回报灵活配置基金净值工资总额利税总额资产总额社保统筹总额和个人总额