spark DaraFrame 和hive互转

来源:互联网 发布:东华软件新闻 编辑:程序博客网 时间:2024/05/21 02:33

 //在目前企业级大数据Spark开发的时候,绝大多数情况下是采用Hive作为数据仓库

    //Spark提供了HIve的支持功能,Spark通过HiveContext可以直接操作Hive中的数据

    //基于HiveContext我们可以使用sql/hql两种方式才编写SQL语句对Hive进行操作,

    //包括创建表、删除表、往表里导入数据 以及用SQL语法构造 各种SQL语句对表中的数据进行CRUD操作   

    //第二:也可以直接通过saveAsTable的方式把DaraFrame中的数据保存到Hive数据仓库中

    //第三:可以直接通过HiveContext.table方法来直接加载Hive中的表而生成DataFrame

                   例:df=hiveContext.table("app.app_healthy_qty")