日志流量分析案例
来源:互联网 发布:金融软件开发公司 编辑:程序博客网 时间:2024/06/04 18:13
案例需求
创建hive表
创建用户
create database db_pra;
创建表
create table if not exists db_log(id string ,url string ,referer string ,keyword string ,type string ,guid string ,pageId string ,moduleId string ,linkId string ,attachedInfo string ,sessionId string ,trackerU string ,trackerType string ,ip string ,trackerSrc string ,cookie string ,orderCode string ,trackTime string ,endUserId string ,firstLink string ,sessionViewNo string ,productId string ,curMerchantId string ,provinceId string ,cityId string ,fee string ,edmActivity string ,edmEmail string ,edmJobId string ,ieVersion string ,platform string ,internalKeyword string ,resultSum string ,currentPage string ,linkPosition string ,buttonPosition string )partitioned by (day string ,hour string)row format delimited fields terminated by '\t';
加载数据
load data local inpath '/opt/datafile/2015082819' overwrite into table db_log partition(day ='20150828',hour ='18');
查看是否load成功
需求分析 :统计分析每日各时段的PV, UV
统计条目数量
select count(*) sum from db_pra.db_log where data='20150828';
分析PV,UV
PV:统计所有用户总的点击次数
UV:Unique Visitor,访问您网站的一台电脑客户端为一个访客
select data,hour,count(url) pv, count(distinct guid) uv from db_log where data='20150828' group by data,hour;
根据day,hour分组
查看结果
将数据放入hive表中
创建结果表
包括day,hour,pv,uv,四列
create table if not exists db_log_result(day string ,hour string,pv string,uv string)row format delimited fields terminated by '\t';
加载结果数据到hive表
insert into table db_log_result select data,hour,count(url) pv, count(distinct guid) uv from db_log where data='20150828' group by data,hour;
查看结果
导出数据到mysql
创建结果数据表
create table if not exists sqoop_test.db_log_result(day varchar(255) not null,hour varchar(255) default null,pv varchar(255) default null,uv varchar(255) default null,primary key(day,hour) )
使用sqoop将数据从hive导出到mysql
bin/sqoop export \--connect jdbc:mysql://localhost:3306/sqoop_test \--username root \--password 123456 \--table db_log_result \--num-mappers 1 \--export-dir /user/hive/warehouse/db_pra.db/db_log_result \--input-fields-terminated-by "\t"
查看结果
0 0
- 日志流量分析案例
- 日志分析一个案例
- Spark日志分析案例
- Hive日志分析案例
- 网站流量日志复杂分析(二)
- Hive日志分析案例二
- 网站日志分析项目案例
- 某电商网站流量劫持案例分析与思考
- 某电商网站流量劫持案例分析与思考
- 网站日志统计案例分析与实现
- Hive学习五--日志案例分析
- Spark学习四:网站日志分析案例
- Hive日志分析案例(一)
- 十九、Hive日志分析案例一
- 网站日志统计案例分析与实现
- 使用SparkSQL 分析日志中IP数、流量等数据
- Hadoop 案例7-----日志分析:分析非结构化文件
- Jboss-eap-6日志输出与案例分析
- 数据库常用指令之增删改查分页
- 35.Oracle深度学习笔记——关于dbms_shared_pool. MARKHOT
- Activity的生命周期
- 剑指offer 打印1到最大的N位数
- 36.Oracle深度学习笔记——SLOB 工具使用
- 日志流量分析案例
- CodeForces-630 I. Parking Lot【排列组合】
- bzoj3573: [Hnoi2014]米特运输
- C#的序列化和反序列化 TEST -XML
- 梅森素数(2013蓝桥杯java—A组题目)
- swift:ViewController中自定义tableView简单入门
- javascript 表达式和语句
- Scanner和BufferedReader的区别
- DES加密系统