对访问日志数据进行读取,清洗,分析,绘图和储存
来源:互联网 发布:pid算法 编辑:程序博客网 时间:2024/05/22 07:49
要求的日志格式为七牛cdn日志格式
110.110.110.110 HIT 10 [19/Apr/2016:00:00:00 +0800] "GET http://example.qiniu.info/in/2016/02/04/F01A9B39-45BF-AFF4-DB19-F85B9E4BD142.jpg?imageMogr2/format/png/thumbnail/480x%320E/quality/80! HTTP/1.1" 200 5136 "-" "Dalvik/1.6.0 (Linux; U; Android 4.4.4; 1105 Build/KTU84P)"
或满足下列标准格式。
注意:如果满足则is_qiniu参数设置为f,如果不满足且不是七牛日志格式仍设置为f,会报KeyError: ‘request_time’。
github链接地址
1.配置日志路径和环境变量
# log_files指定日志的绝对路径[log_files]file_path:/Users/berniey/Documents/fun/Qiniu-cdnLog/log_path/aaa.bbb.com_2017-07-12-14_part-00000# log_Path指定日志所在目录的绝对路径[log_Path]log_path:/Users/berniey/Documents/fun/Qiniu-cdnLog/log_path
注意:数据库名称默认为cdnlog。
2.命令行调用
在data.py调用实例d的函数,通过命令python3 data.py获得指定的数据
Todo看情况支持命令行参数
3.接口调用
python3 api.py 启动flask实例,用接口调用
请求格式:
http://127.0.0.1/api_path?<arg>=<value>&<arg>=<value>...
示例:
- http://127.0.0.1:5000/get_total_data?limit=:100
查找前10000条数据里某一ip某一url的数据
- http://127.0.0.1:5000/get_url_traffic?limit=:100&is_show=t&kind=bar&dis_tick=x
对前100条数据绘图,生成bar,隐藏x轴刻度
3.http://127.0.0.1:5000/get_time_traffic?limit=:1000&start_time=2017-07-12%2022:00:00&end_time=2017-07-12%2022:16:47&is_show=t&kind=line前1000条数据中从2017-07-12 22:00:00到2017-07-12 22:16:47流量的线形图
4.http://127.0.0.1:5000/get_code_count?is_show=t&kind=pie不同状态码数量的pie图
5.http://127.0.0.1:5000/get_ip_url_code_count?limit=:1000&save=mysql&pt=ip_url_code_count 将每个ip的每个url的状态码的统计数量中的前1000条保存在mysql,表名为ip_url_code_count
6.http://127.0.0.1:5000/get_url_code_count?limit=:1000&save=csv&pt=/Users/l2017006/Documents/rm/test/get_url_code_count.csv 将每个url的每个状态码的统计数量中的前1000条保存为csv文件,路径为/Users/l2017006/Documents/rm/test/get_url_code_count.csv
- 对访问日志数据进行读取,清洗,分析,绘图和储存
- 利用pandas对数据进行基本清洗
- matplotlib进行绘图分析数据
- matplotlib绘图进行数据分析
- 网站日志分析项目案例(二)数据清洗
- hive分析nginx日志之UDF清洗数据
- 利用Python进行数据分析--绘图和可视化
- 利用python进行数据分析-绘图和可视化1
- 利用python进行数据分析-绘图和可视化2
- 利用python进行数据分析(六):绘图和可视化
- Flume+Hbase--采集和储存日志数据
- 数据清洗实例分析
- 数据清洗实例分析
- 对LCS进行储存
- 使用spark读取es中的数据并进行数据清洗,使用fp-growth算法进行加工
- 使用SSIS进行数据清洗
- 使用SSIS进行数据清洗
- 使用pandas进行数据清洗
- scala 奇淫巧技
- 卷积与采样还原、滤波器的联系(应用篇)
- Unable to inject views for BcFragment{8d4c0 #1 id=0x7f0d00a1}
- eclipsesvn总是提示输入密码?svn总是提示输入密码的解决!
- JNI中调用加载多个cpp文件的方法
- 对访问日志数据进行读取,清洗,分析,绘图和储存
- 浅谈java基础
- 浮动页面的详解
- 剑指Offer----栈的压入、弹出序列
- Excel无法vlookup事件
- springmvc中一次请求的主要流程图及讲解
- Gluster FS
- java实现给图片添加水印
- android APK内存分配