hive的简单增删改查
来源:互联网 发布:java孤傲苍狼 博客园 编辑:程序博客网 时间:2024/05/16 16:10
安装好hive后,打开hadoop的目录,可以看到,比之前多了一个tmp文件夹,同时user目录下也多了一个hive文件夹
一、建表及插入
数据准备:在本地准备一个word.txt文件,内容如下:
1 小明2 小张3 小美4 小李5 小宋6 小曲7 小樊8 小曲9 小樊10 小明11 小美
每行两个数据,中间用空格隔开
show tables;可以查看所有表
现要建立word表,建表和插入都有两种方法,一是在hdfs上hive的warehouse目录下手动建文件夹word(即为表)、上传本地文件word.txt(即为表中数据);
二是在终端启动hive后使用hive命令
create table word(id int,name string) row format delimited fields terminated by ' '; (表示建立一个id-name的表,两个字段间用空格分开)
上传数据:
load data inpath 'hdfs://localhost:9000/user/zt/input1' into table word;这是从hdfs上上传的,如果想从本地导入,可以使用这个load data local inpath '...'
删除表: drop table word;
二、查询操作
其实和sql语句基本相似。
如查询每个name及出现的次数(类似于MapReduce的WordCount):select name,count(*) from word group by name;
终端显示结果如下:
其实如果是在mysql中运行这样的sql 语句,耗时会更小。这就解释了,hive是适合大数据的,在小数据量并不具有优势,而且也是离线服务的,在线服务耗时太长,用户无法接受。之前介绍的MapReduce也是这样,大数据的体系在数据小的时候效率并不高。
数据去重select distinct(name) from word;
统计id平均值select name,sum(id)/count(name) from word group by name;类似于统计平均成绩:
小宋5.0小张2.0小明5.5小曲7.0小李4.0小樊8.0小美7.0
- hive的简单增删改查
- Hive的基本增删改查代码
- sql的简单的增删改查
- Dom4j的增删改查简单使用
- Extjs tree 的简单增删改查
- Hibernate 简单的增删改查 示例
- SSH整合 简单的增删改查
- 简单的增删改查页面
- mongodb实现简单的增删改查
- 02ThinkPHP的简单增删查改
- SSH整合 简单的增删改查
- Hibernate的简单增删改查例子
- EF简单的增删查改
- SSH整合 简单的增删改查
- EF简单的增删查改
- SSH整合 简单的增删改查
- sql的简单增删改查
- Hibernate实现简单的增删改查
- 特征工程
- 南阳oj 题目127 星际之门(一)
- windows下多python版本下的一个pip错误
- js中几种实用的跨域方法原理详解
- Sftp和ftp over ssh2的区别
- hive的简单增删改查
- jni和C 中文乱码
- 【原创】SSM框架下,添加activiti流程引擎配置--转载请注明出处
- 写作建议
- 主键&外键
- Inventor API:后绑定访问一些Inventor API对象
- C# 通过socket实现UDP 通信
- Android XML绘图之 Selector
- c++-08