textfile转换成rcfile,parquet,hfile
来源:互联网 发布:mac炒股软件哪个好 编辑:程序博客网 时间:2024/05/17 01:23
一、textfile转换成rcfile
通过hive实现
1.1在hive创建表
create table tablename(s string,x string,y string,a double,b double);
1.2然后load data本地textfile
load data local inpath '本地路径的textfile' into table tablename;
或是load data hdfs上的textfile到hive表中
load data inpath 'hdfs路径的textfile‘ into table tablename;
这样hive中tablename表对应的文件,就是textfile要转换成的rcfile文件
二、textfile转换成parquet
通过impala实现
2.1在impala创建表
create table tablename(s string,x string,y string,a double,b double);
2.2然后load data hdfs上的textfile到impala表中
load data inpath 'hdfs路径的textfile’ into table tablename;
这样impala中tablename表对应的文件,就是textfiel要转换成的parquet文件
三、textfile转换成hfile
通过hive和hbase整合实现
3.1在hive中创建hbase识别的表
create table hbase_hive_table(s string,x string,y string,a double,b double)
stored by 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
with serdeproperties ("hbase.columns.mapping" = ":key,info:y,info:z,info:a,info:b")
tblproperties("hbase.table.name" = "hbase_hive_table");
3.2在hive创建表
create table tablename(s string,x string,y string,a double,b double);
3.3然后load data本地textfile
load data local inpath '本地路径的textfile' into table hbase_hive_table;
或是load data hdfs上的textfile到hive表中
load data inpath 'hdfs路径的textfile‘ into table hbase_hive_table;
3.4在hive导入数据到hbase识别的表中
insert into table hbase_hive_table select * from tablename;
这样hbase中hbase_hive_table表对应的文件,就是textfile要转换成的hfile文件
通过hive实现
1.1在hive创建表
create table tablename(s string,x string,y string,a double,b double);
1.2然后load data本地textfile
load data local inpath '本地路径的textfile' into table tablename;
或是load data hdfs上的textfile到hive表中
load data inpath 'hdfs路径的textfile‘ into table tablename;
这样hive中tablename表对应的文件,就是textfile要转换成的rcfile文件
二、textfile转换成parquet
通过impala实现
2.1在impala创建表
create table tablename(s string,x string,y string,a double,b double);
2.2然后load data hdfs上的textfile到impala表中
load data inpath 'hdfs路径的textfile’ into table tablename;
这样impala中tablename表对应的文件,就是textfiel要转换成的parquet文件
三、textfile转换成hfile
通过hive和hbase整合实现
3.1在hive中创建hbase识别的表
create table hbase_hive_table(s string,x string,y string,a double,b double)
stored by 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
with serdeproperties ("hbase.columns.mapping" = ":key,info:y,info:z,info:a,info:b")
tblproperties("hbase.table.name" = "hbase_hive_table");
3.2在hive创建表
create table tablename(s string,x string,y string,a double,b double);
3.3然后load data本地textfile
load data local inpath '本地路径的textfile' into table hbase_hive_table;
或是load data hdfs上的textfile到hive表中
load data inpath 'hdfs路径的textfile‘ into table hbase_hive_table;
3.4在hive导入数据到hbase识别的表中
insert into table hbase_hive_table select * from tablename;
这样hbase中hbase_hive_table表对应的文件,就是textfile要转换成的hfile文件
0 0
- textfile转换成rcfile,parquet,hfile
- hive优化-文件格式-rcfile-textfile-seqfile
- impala表使用rcfile,sequencefile和parquet
- TextFile
- Parquet_9. 将CSV 文件转换成 Parquet 格式 -- 待完善
- rcfile
- RcFile
- HFile
- hfile
- HFile
- HIve的rcfile文件存储格式的介绍以及如何将HIve的textfile文件存储格式转化为rcfile文件格式
- Parquet
- Parquet
- Parquet
- Bulkload 将Hdfs转换为Hfile的一个Demo
- 将 Spark 中的文本转换为 Parquet 以提升性能
- 将 Spark 中的文本转换为 Parquet 以提升性能
- 将 Spark 中的文本转换为 Parquet 以提升性能
- hive的UDF
- Git快速入门——Git安装、创建版本库以及常用命令
- tomcat 启动 java.sql.SQLException: No suitable driver found for proxool.web
- gdb使用
- Qt之对话框设计——电子时钟
- textfile转换成rcfile,parquet,hfile
- css样式表中的样式覆盖顺序
- rrrrr
- Sql复杂查询
- Java多线程并发总结
- Android Service与Activity之间通信的几种方式
- MYSQL 8 Hours Time out Problem
- java程序性能优化
- 利用spring el做系统日志