python解析基于xml格式的日志文件
来源:互联网 发布:计算机二级vb视频教程 编辑:程序博客网 时间:2024/06/05 22:39
大家中午好,由于过年一直还没回到状态,好久没分享一波小知识了,今天,继续给大家分享一波python解析日志的小脚本。
首先,同样的先看看日志是个啥样。。。
都是xml格式的,是不是看着就头晕了??没事,我们先来分析一波。
1.每一段开头都是catalina-exec,那么我们就按catalina-exec来分,分了之后,他们就都是一段一段的了。
2.然后,我们再在已经分好的一段段里面分,找出你要分割的关键字,因为是xml的,所以,接下来的工作就简单了,都是一个头一个尾的。
3.但是还有一个问题,有可能有的里面没有你想要的关键字,所以你要判断下,如果没有这个字段,那么我就把这个字段设置为空。
思路清晰了,代码自然而然就简单了。
接下来我们就看看代码
#coding:utf-8import re#文本所在TXT文件file = 'iag_interface.log'#分割一段xml1='catalina-exec'xml2='catalina-exec'#关键字reqtimestamptime1 = '<timestamp>'time2 = '</timestamp>'#关键字functionidfunctionid1 = '<functionid>'functionid2 = '</functionid>'#关键字transidtransid1='<transid>'transid2='</transid>'#关键字siappidsiappid1='<siappid>'siappid2='</siappid>'#关键字useriduserid1='<userid>'userid2='</userid>'#关键字mobnummobnum1='<mobnum>'mobnum2='</mobnum>'f = open(file,'r',encoding= 'utf-8')#f = open(file,'r')#for (num,value) in enumerate(f):#print("line number",num,"is:",value)buff = f.read()#清除换行符,请取消下一行注释#buff = buff.replace('\n','')pat= re.compile(time1+'(.*?)'+time2,re.S)pat1 = re.compile(functionid1+'(.*?)'+functionid2,re.S)pat2 = re.compile(transid1+'(.*?)'+transid2,re.S)pat3 = re.compile(siappid1+'(.*?)'+siappid2,re.S)pat4 = re.compile(userid1+'(.*?)'+userid2,re.S)pat5 = re.compile(mobnum1+'(.*?)'+mobnum2,re.S)pat6=re.compile(xml1+'(.*?)'+xml2,re.S)result6 = pat6.findall(buff)print(len(result6))x = open("logfx.txt", 'w')x.write("===========================开始数据================================="+"\n")x.write("time"+"\t"+"functionid"+"\t"+"transid"+"\t"+"siappid"+"\t"+"userid"+"\t"+"mobnum"+"\n")for i in range(0,len(result6)):result = pat.findall(result6[i])result1 = pat1.findall(result6[i])result2 = pat2.findall(result6[i])result3 = pat3.findall(result6[i])result4 = pat4.findall(result6[i])result5 = pat5.findall(result6[i])if len(result)==0:result.append("空")if len(result1)==0:result1.append("空")if len(result2)==0:result2.append("空")if len(result3)==0:result3.append("空")if len(result4)==0:result4.append("空")if len(result5)==0:result5.append("空")#print(result[0],"=",result1[0],"=",result2[0],"=",result3[0],"=",result4[0],"=",result5[0])x.write("timestamp:"+result[0]+"\t"+result1[0]+"\t"+result2[0]+"\t"+result3[0]+"\t"+result4[0]+"\t"+"mobnum:"+result5[0]+"\n")x.write("===========================结束数据================================="+"\n")print("执行完毕!生成文件logfx.txt")x.close()
运行下代码
把所有数据运行成功了。接下来查看文件
好了,这个逼就装到这里了,转发请注明出处啊!
5 0
- python解析基于xml格式的日志文件
- Tinyxml解析XML格式的文件
- python如何读取xml格式的文件
- C++下基于COM的XML格式字符串解析,生成
- C++下基于COM的XML格式字符串解析,生成
- C++下基于COM的XML格式字符串解析,生成
- java学习:log4j输出xml格式的日志文件
- Python解析XML文件
- python 解析xml文件
- python解析xml文件
- Python 解析XML文件
- Python解析XML文件
- Python解析XML文件
- Python 解析XML文件
- python解析XML文件
- Python 解析xml文件
- Python xml文件解析
- python解析xml文件
- 线性表的顺序存储
- 455. Assign Cookies
- POJ 2411 Mondriaan's Dream [状压DP做法]
- HDOJ 1005 Java 答案
- 深度学习caffe实战(一)验证码识别
- python解析基于xml格式的日志文件
- codeforces 399 E. Game of Stones 博弈 思维题
- javascript Object.is 与 === 的区别
- 昇润科技将在三月底推出CC2640R2 SDK开发平台
- 可以设置宽高比,宽度确定,高度比例缩放的ImageView快速实现
- JVM调优总结(十)-调优方法
- 基于kubernetes和SpringCloud微服务构建方案
- ios 判断app程序第一次启动方法
- JAVA从入门到精通(4)