pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换
来源:互联网 发布:网络防攻击软件 编辑:程序博客网 时间:2024/06/05 04:01
代码如下,步骤流程在代码注释中可见:
# -*- coding: utf-8 -*-import pandas as pdfrom pyspark.sql import SparkSessionfrom pyspark.sql import SQLContextfrom pyspark import SparkContext#初始化数据#初始化pandas DataFramedf = pd.DataFrame([[1, 2, 3], [4, 5, 6]], index=['row1', 'row2'], columns=['c1', 'c2', 'c3'])#打印数据print df#初始化spark DataFramesc = SparkContext()if __name__ == "__main__": spark = SparkSession\ .builder\ .appName("testDataFrame")\ .getOrCreate()sentenceData = spark.createDataFrame([ (0.0, "I like Spark"), (1.0, "Pandas is useful"), (2.0, "They are coded by Python ")], ["label", "sentence"])#显示数据sentenceData.select("label").show()#spark.DataFrame 转换成 pandas.DataFramesqlContest = SQLContext(sc)spark_df = sqlContest.createDataFrame(df)#显示数据spark_df.select("c1").show()# pandas.DataFrame 转换成 spark.DataFramepandas_df = sentenceData.toPandas()#打印数据print pandas_df
程序结果
阅读全文
1 0
- pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换
- numpy中的ndarray与pandas的Series和DataFrame之间的相互转换
- spark: RDD与DataFrame之间的相互转换
- pandas.DataFrame.any与pandas.DataFrame.all
- pandas.Dataframe 的合并
- Pandas DataFrame 日常的操作与发现
- Spark与Pandas中DataFrame的对比
- pandas.dataframe 转换(笔记)
- Pandas DataFrame
- Pandas(DataFrame)
- pandas-dataframe
- NumPy.npy与pandas DataFrame
- Spark RDD 与 Pandas Dataframe
- spark下rdd和dataframe以及sqlcontext之间相互转换
- numpy的ndarray与pandas的series和dataframe之间互转
- python 的pandas DataFrame大全
- Pandas 创建空的DataFrame
- pandas的dataframe 条件查询
- oj(数组排序) 2770: 数组做函数参数------排序函数1
- php curl网络爬虫简单实例代码
- linux常用命令
- Hibernate双向多对多 注解方式
- matlab笔记(4)----程序流程语句
- pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换
- cordova学习使用第一章
- MOOC-大型开放式网络课程massive open online courses
- hive表的关联
- Codeforces 804B
- iOS 经典全部面试题(上)
- http状态码
- 另一种阶乘问题
- oj 2771: 数组做函数参数--排序函数2