pyhs2读取Hive
来源:互联网 发布:多功能qq视频录像软件 编辑:程序博客网 时间:2024/05/29 09:19
版本/平台原因,SparkSql无法读取实时ORC分区表,采用Pyhs2读取
import pyhs2 #连接hive客户端def get_hiveserver_connect(): con=pyhs2.connect(host="localhost", port=8000, authMechanism="KERBEROS", user="xxxx", database="default") return con #执行语句,返回 List[Dict]def get_hive_result(consql): con = get_hiveserver_connect() print con cur = con.cursor() print cur cur.execute(consql) columns=[] list_data=[] #获取列字段信息 for j in cur.getSchema(): columns.append(j['columnName']) data_list=cur.fetch() #将字段信息和数据映射为字典 for data in data_list: list_data.append(dict(zip(columns,data))) con.close() return list_dataconsql = "select pv,uv from test1"print get_hive_result(consql)# Return: [{'uv': 200, 'pv': 100}, {'uv': 220, 'pv': 110}]
阅读全文
0 0
- pyhs2读取Hive
- 基于python impyla,pyhs2的hive客户端
- python hive-1.2.1 pyhs2 ; python 连接hive
- 使用python来操作hive(通过 pyhs2 和 HiveServer2)
- centos 安装 py pyhs2
- python pyhs2 的安装
- pyhs2搭建详细过程
- windows环境安装pyhs2
- RJDBC读取HIVE
- 读取注册表hive文件
- spark-sql读取hive
- spark 读取hive parquet
- hive读取es数据
- hiveContext读取hive数据
- hcatalog读取hive数据并写入hive
- ImportError: No module named pyhs2
- 使用hive读取hbase数据
- 使用hive读取hbase数据
- Spring初探之AOP(面向切面编程)
- RQNOJ 311 [NOIP2000]乘积最大:划分型dp
- Office365学生订阅+Visio2016ProVOL
- jvm之对象的创建
- adb发送广播
- pyhs2读取Hive
- PLSQL创建命名空间和用户以及授权
- java excel导入和导出(poi,jxl)
- js把变量设置成缓存并给下一个页面的input赋值
- 1-2、数字图像处理基础
- jvm之对象的内存布局
- android studio编辑gradle文件卡顿问题解决
- 向Matlab中添加“野生”数据并简单分析(1)
- SER2016 DIV1 问题 H: Paint(区间问题贪心+dp优化)