把csv入库到hadoop集群
来源:互联网 发布:kmp算法学不会怎么办 编辑:程序博客网 时间:2024/05/01 06:59
--建立文本表
create table tmp.S_CONF_GRIDDING_LST_text(
s_id varchar(160)
,s_date timestamp
)ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE ;
--拷贝到hdfs
[root@MASTER01 ~]# hadoop fs -copyFromLocal /root/008.csv /user/hive/warehouse/tmp.db/
[root@MASTER01 ~]# hadoop fs -ls hdfs://MASTER01:8020/user/hive/warehouse/tmp.db/008.csv
-rw-r--r-- 3 root hive 48 2016-04-15 12:53 hdfs://MASTER01:8020/user/hive/warehouse/tmp.db/008.csv
[root@MASTER01 ~]#
--load到文本表
LOAD DATA INPATH '/user/hive/warehouse/tmp.db/008.csv' OVERWRITE INTO TABLE S_CONF_GRIDDING_LST_text;
Query: load DATA INPATH '/user/hive/warehouse/tmp.db/008.csv' OVERWRITE INTO TABLE S_CONF_GRIDDING_LST_text
+----------------------------------------------------------+
| summary |
+----------------------------------------------------------+
| Loaded 1 file(s). Total files in destination location: 1 |
+----------------------------------------------------------+
Fetched 1 row(s) in 0.11s
--建立正式表
[slave02:21000] > create table tmp.S_CONF_GRIDDING_LST(
> s_id varchar(160)
> ,s_date timestamp
> )stored as parquet;
--把文本表放入正式表
insert into S_CONF_GRIDDING_LST select * from S_CONF_GRIDDING_LST_text;
create table tmp.S_CONF_GRIDDING_LST_text(
s_id varchar(160)
,s_date timestamp
)ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE ;
--拷贝到hdfs
[root@MASTER01 ~]# hadoop fs -copyFromLocal /root/008.csv /user/hive/warehouse/tmp.db/
[root@MASTER01 ~]# hadoop fs -ls hdfs://MASTER01:8020/user/hive/warehouse/tmp.db/008.csv
-rw-r--r-- 3 root hive 48 2016-04-15 12:53 hdfs://MASTER01:8020/user/hive/warehouse/tmp.db/008.csv
[root@MASTER01 ~]#
--load到文本表
LOAD DATA INPATH '/user/hive/warehouse/tmp.db/008.csv' OVERWRITE INTO TABLE S_CONF_GRIDDING_LST_text;
Query: load DATA INPATH '/user/hive/warehouse/tmp.db/008.csv' OVERWRITE INTO TABLE S_CONF_GRIDDING_LST_text
+----------------------------------------------------------+
| summary |
+----------------------------------------------------------+
| Loaded 1 file(s). Total files in destination location: 1 |
+----------------------------------------------------------+
Fetched 1 row(s) in 0.11s
--建立正式表
[slave02:21000] > create table tmp.S_CONF_GRIDDING_LST(
> s_id varchar(160)
> ,s_date timestamp
> )stored as parquet;
--把文本表放入正式表
insert into S_CONF_GRIDDING_LST select * from S_CONF_GRIDDING_LST_text;
0 0
- 把csv入库到hadoop集群
- List入库,把List1中的数据入库到List2中
- 把Nutch爬虫部署到Hadoop集群上
- (31个省实体厅流量监测csv文件入库)mysql到oracle应用迁移测试及测试中mysql集群故障报告
- 把多个CSV文件加载到一个EXCEL文件
- C#_把dataTable数据导出到CSV,XLS文件
- 把CSV文件导入到SQL Server表中的方法
- 把CSV文件导入到SQL Server表中
- 把数据库文件写入csv文件和从csv文件中导入数据到数据库中
- 在rails 4 中 使用 CSV 组件来 把csv文件导入到数据库
- Import CSV into Sharepoint List 把csv导入到sharepoint列表
- 监听器监听日志,实时读取日志文件,把读取到的数据入库
- Eclipse连接到hadoop集群详解
- Hadoop Streaming如何传文件夹到集群
- Hadoop-添加新节点到集群
- 如何获取到Hadoop集群的个数
- Hadoop本地提交到集群中
- 从0到1:搭建Hadoop集群
- MATLAB频谱分析程序(转)
- Dijstra 单源最短路径算法 堆优化-1(二维数组存储数据)
- java基础(3)--java.lang.ClassLoader类的用法
- python开发的10个技巧
- 用指针传递 将句子翻转
- 把csv入库到hadoop集群
- IntelliJ IDEA快捷键
- 大表设计思路
- Oracle--数据库范式详解
- leetcode 74. Search a 2D Matrix
- 机器视觉开源代码集合
- 犬儒主义
- 不使用Maven的情况下,搭建Spring+Struts+Hibernate框架 - jar包与配置文件
- Window 7 自动登录