Hive的数据存储

来源:互联网 发布:minix源码百度云 编辑:程序博客网 时间:2024/05/17 03:14

Hive是基于Hadoop之上的数据仓库,所以Hive中的数据都是保存在HDFS文件系统中。在Hive中创建一张表,会自动在HDFS中创建一个文件夹,而在表中保存的数据对应该文件夹下的文件。
1、使用命令show tables查看Hive数据仓库中存在的表
这里写图片描述
2、查询其中一个表employee的数据,这个数据对应HDFS下的文件夹和文件
这里写图片描述
3、使用Hadoop对应的web管理工具来查看数据,访问地址是master_ip:50070/,首页如下
这里写图片描述
4、点击”Utilities”下的”Browse the file system”,可看到如下界面
这里写图片描述
5、从步骤4中知道,根目录下有两个目录,tmpusr目录,由于hive 目录存在usr 下,所以依次访问usr-hive-warehouse ,得到的目录就对应hive数据仓库中的表,表名和文件夹的名字是一样的
这里写图片描述
6、点击employee 文件夹,得到如下界面
这里写图片描述
7、点击employee.txt 文件,可进行下载查看
这里写图片描述
下载后查看该文件内容和在hive中查询的结果相同
这里写图片描述

原创粉丝点击