简单的项目使用flume,hive,sqoop,flume
来源:互联网 发布:经典球员数据 编辑:程序博客网 时间:2024/05/16 11:53
这是一个自动化的脚本,每天定时启动使用crontab进行配置即可
CURRENT=`/bin/date +%y%m%d`
数据清洗#/usr/local/hadoop-2.4.1/bin/hadoop jar /home/hadoop/cleaner.jar /flume/$CURRENT /cleaned/$CURRENT
#/usr/local/apache-hive-0.13.0-bin/bin/hive -e "alter table bbs add partition (logdate=$CURRENT) location '/cleaned/$CURRENT'"
数据分析
#/usr/local/apache-hive-0.13.0-bin/bin/hive -e "select count(*) from bbs where logdate = $CURRENT"
#/usr/local/apache-hive-0.13.0-bin/bin/hive -e "select count(distinct ip) from bbs where logdate = $CURRENT"
#/usr/local/apache-hive-0.13.0-bin/bin/hive -e "select count(*) from bbs where logdate = $CURRENT and instr(url, 'member.php?mod=register')>0;"
#/usr/local/apache-hive-0.13.0-bin/bin/hive -e "create table vip_$CURRENT row format delimited fields terminated by '\t' as select ip, count(*) as vtimes from bbs where logdate = $CURRENT group by ip having vtimes >= 50 order by vtimes desc limit 20"
数据导出到关系型数据句酷
/usr/local/sqoop-1.4.4/bin/sqoop export --connect jdbc:mysql://192.168.1.100:3306/usertable--username root --password 123 --export-dir "/user/hive/warehouse/vip_$CURRENT" --table vip --fields-terminated-by '\t'
0 0
- 简单的项目使用flume,hive,sqoop,flume
- flume的简单使用
- flume-ng的简单使用
- flume串联的简单使用
- Hadoop详解(七)——Hive的原理和安装配置和UDF,flume的安装和配置以及简单使用,flume+hive+Hadoop进行日志处理
- flume的安装和简单使用
- Flume的安装与简单使用
- Hadoop教程(五):Flume、Sqoop、Pig、Hive、OOZIE
- 论坛日志分析:Flume+MapReduce+Hive+Sqoop+MySQL
- Flume的简单了解:
- flume使用hive stream写入到hive
- Logstash,flume,sqoop比较
- 05 flume--Azkaban--sqoop
- Logstash,flume,sqoop比较
- flume学习(六):使用hive来分析flume收集的日志数据
- flume学习(六):使用hive来分析flume收集的日志数据
- flume学习(六):使用hive来分析flume收集的日志数据
- flume学习(六):使用hive来分析flume收集的日志数据
- (三十八)通用模型与QVariant
- 【C++】《C++ Primer Plus》笔记(6)——内存模型和命名空间
- HDU 4430 Yukari's Birthday
- 使用manifestPlaceholders替换变量
- git permission denied (publickey) 解决办法
- 简单的项目使用flume,hive,sqoop,flume
- 怎样看70年前的今天在台湾发生的2.28事件
- BDD1.4安装全记录,真的很全了
- php结合redis实现高并发下的抢购、秒杀功能
- 下拉刷新、上拉加载实战:带你理解自定义View整个过程
- java正则表达式详解
- linux ----- rm
- 推荐算法简述
- 将本地mysql数据库表格导入到odps大数据计算服务项目中