Hql:数据定义

来源:互联网 发布:男鞋推荐 知乎 编辑:程序博客网 时间:2024/06/09 20:21

参数设置

1.set hive.cli.print.current.db=true可以上CLI显示当前的数据库名称;

2.可以用like 配合正则表达式查询相应条件的数据库名。show database like 'hji.*';//显示以hji开头的数据库

3.用create database创建数据库的时候会在hive.metastore.warehouse.dir相应的目录下创建相应数据库命名的文件夹,下面存储表

(default数据库除外,没有default.db命名的文件夹存在)

4.用关键字comment可以添加描述信息。

5.hive不允许用户删除一个有表的数据库的,要删除可以再后面添加cascade。如:drop database financial cascade;

(如果某个数据库被删除了其相应的文件夹也会被删除)

6.修改数据库

alter database financial set dbproperties('edited-by'='hadoop');

7.在创建表时,如果当前所在的数据库并非目标数据库可以用create table 数据库名.tablename创建。可以用comment为每个字段添加解释信息。

8.用户还可以拷贝一张已经存在的表,create [external] table if not exists 数据库名.student1 like 数据库名.student;

9.创建表时可以partition指定分区情况,如:

create table student(id int,name string,class string,provice string)partition by (class string,provice string);

查询时可以用select * from student where class='....' anf provice='hebei';

对于非常大的数据集,分区可以显著地提高查询性能。

0 0