查找包含某字符串的文件

来源:互联网 发布:正则匹配ip端口号 编辑:程序博客网 时间:2024/06/04 21:16

想操作一个DbUtil类,现在要找出工程里,哪些方法使用了DbUtil类的方法。

一、不过刚好想试试python,就边查边写了python脚本来做。
思路是,找出工程中所有java文件,读取文件内容,如果找到com.util.DbUtil语句,就返回文件名。
代码:

# -*- coding: utf-8 -*-import osimport reimport codecs#找到所有文件def iter(path):    for home, dirs, files in os.walk(path):        for filename in files:            yield os.path.join(home, filename)#找到使用该类的文件,用正则匹配def getfiles(filename,encode):        filenames = []        path = "E:\\workspace\\" + filename         for fullname in iter(path):                if os.path.splitext(fullname)[1] == '.java':                        file = codecs.open(fullname, 'r',encode)                        for line in file:                                if re.match(r'.*com.util.app.DbUtil.*',line):                                        filenames.append(fullname)                                        break                        file.close()        out = codecs.open('d:\\cfile\\'+filename+'.txt','w')        print(filename,file=out)        print(filenames,file=out)        out.close()        print(filename," ok")#由于几个工程使用编码不同(编码问题好坑),所以分两次查找,一类是utf-8,一类是gbk。if __name__ == '__main__':    names = ['compensation','cost','shr_cost','social']    difnames = ['shr_compensation','shr_social']    for name in difnames:            getfiles(name,'gbk')    for name in names:            getfiles(name,'utf-8')

最近喜欢尝试新东西,python还是挺好用的。不过编码还是要注意。用codecs库可以使用不同的编码方式。

二、发现Linux 命令更简洁。

寻找包含“com.util.app.DbUtil”的java文件,输出结果用awk分割,’:’前是文件路径,后面是匹配的文件行内容,最后把文件名追加到result中。

find . -name *.java | xargs grep "com.util.app.DbUtil" | awk -F ':' '{print $1}'>> result

interesting!

0 0
原创粉丝点击