[日志分析]在nginx日志中,提取有效的request uri
来源:互联网 发布:node实战 编辑:程序博客网 时间:2024/04/30 06:54
最近在做公司的nginx log分析,其中一个需求是提取这个月每天被访问Top10的页面,及其访问量。
做这个需求,首先要清洗出有效的页面访问。我采用排除法,去掉 .js .css之类的访问。但最初,我并不能全面的了解要去掉带有哪些后缀的request。
经过清洗 -> 抽样 -> 清洗 -> 抽样 -> 清洗,最终需要过滤掉含有下列后缀的uri
.js .css . gif .jpeg .jpg .png .ico .txt .swf .xml .JPEG .PNG .JPG
#python代码:if re.search(r"(\.js|\.css|\.gif|\.jpe?g|\.png|\.ico|\.txt|\.swf|\.JPE?G|\.PNG|\.xml)", request[1]): continue
不同公司的日志可能存在一些特殊情况,这还需要抽样分析
0 0
- [日志分析]在nginx日志中,提取有效的request uri
- nginx的日志分析
- Nginx日志中有用的分析脚本
- nginx日志数据提取
- python分析nginx中access日志
- awk分析nginx日志
- nginx错误日志分析
- Linux Nginx日志分析
- awstats分析nginx日志
- nginx 日志分析
- nginx分析日志
- Nginx 日志分析
- nginx日志模块分析
- nginx日志分析
- Awstats分析Nginx日志
- nginx日志错误分析
- awstats分析nginx日志
- Awstats分析nginx日志
- LeetCode之Insertion Sort List
- 2015年网页设计的9大趋势
- 2015ACM多校对抗赛第四场 hdu 5336
- POJ 1573 Robot Motion(模拟)
- dos命令之find
- [日志分析]在nginx日志中,提取有效的request uri
- 【Win10】联想Z50-70升级到Win10,声音变成环绕声解决办法
- 织梦5.7DEDECMS标签大全
- 矩阵优化的模板(用的时候注意要修改呀)
- EJB学习笔记之十(BMT事务和CMT事务)
- jQuery FlexSlider插件的详细设置参数
- Unity3d实现画笔
- centos7 下安装Apache2+MariaDB+PHP5过程详解
- Qt中使用html语言对word进行图表操作