HiveQL:数据操作
来源:互联网 发布:java智能仓库管理系统 编辑:程序博客网 时间:2024/05/06 17:16
通过导入本地文件来装载数据(overwrite关键字表示重写,即会覆盖掉原来的数据,如果没有overwrite,或者用into关键字来替换它的话,数据将以追加的方式写入):
hive> load data local inpath '/usr/my/database/Chinese-employees'overwrite into table employees;
通过查询语句来向表中插入数据:
hive> insert overwrite table employeespartition (country='US',state='OR')select * from staged_employees se where se.country='US' and se.st="OR";
以下这三种insert语句执行效率会更高一点:
hive> from staged_employees seinsert overwrite table employeespartition(country='US',state='OR')select * where se.cnty='US' and se.st='OR';hive> insert overwrite table employeespartition(country='US',state='CA')select * where se.cnty='US' and se.st='CA';hive> insert overwrite table employeespartition(country='US' and state='IL')select * where se.cnty='US' and se.st='IL';
动态分区插入(基于查询参数推断出需要创建的分区名称),以下的例子是根据select语句中的最后2列来确定分区字段country和state的值(…表示的是该表的其他列,此处省略不写):
hive> insert overwrite table employeespartition(country,state)select ...,se.cnty,se.stfrom staged_employees se;
当然,你也可以混合使用动态和静态分区,以下的例子就是指定了country字段的值为静态的US,而分区字段state是动态值(静态分区键必须要出现在动态分区键之前):
hive> insert overwrite table employeespartition(country='US',state)select ...,se.cnty,se.stfrom staged_employees sewhere se.cnty='US';
动态分区功能默认情况是没有开启的。开启后,默认是以“严格”模式执行的,在这种模式下要求至少有一列分区字段是静态的。
动态分区属性
单个查询语句中创建表并加载数据:
hive> create table ca_employeesas select name,salary,addressfrom employeeswhere se.state='CA';
导出数据:
hive> insert overwrite local directory 'tmp/ca_employees'select name,salary,addressfrom employeeswhere se.state='CA';
附我在开源中国的原文:
https://my.oschina.net/lonelycode/blog/834989
0 0
- HiveQL:数据操作
- HiveQL:数据操作
- HiveQL:数据操作
- Hive--HiveQL:数据定义、数据操作
- Hive编程(五)【HiveQL:数据操作】
- HiveQL 常用操作
- HiveQL基本操作整理
- HiveQL 常用操作
- HiveQL数据定义
- HiveQL:数据定义
- HiveQL数据定义
- HiveQL:数据定义
- HiveQL:数据定义
- hiveQL数据定义
- 大数据生态系统基础: HIVE(二):HIVE 架构和HiveQL基本操作
- hiveQL
- hiveQL学习和hive常用操作
- HiveQL 数据定义语言使用(一)—Hive中数据库的创建、显示、删除和修改操作介绍
- 哈希表(HashTable)笔记
- java的动态代理机制详解
- 20170215C语言提升08_指针_02数组指针及指针数组及函数指针
- iOS CRC 校验
- Android ViewPager 和PageTransformer滑动颜色渐变
- HiveQL:数据操作
- 蓝桥杯 2016 10 最大比例
- 西门子300中时钟寄存器的使用
- 在sap系统设置纸张打印格式
- Windows Container 和 Docker:你需要知道的5件事
- 网站名词解释
- Fiddler拦截并修改移动端请求
- SimpleDateFormat格式类型
- android JNI相关的代码