用python第三方库xlwt解决数据提取后存到execl

来源：互联网发布：魔兽之路隐藏英雄数据编辑：程序博客网时间：2024/05/22 12:15

在做文本处理的时候需要将txt里的部分文件提取到execl中，因为刚开始学python不太熟悉，正则表达式也是初学，是一头雾水，就度娘了一下，别人都提到xlwt是处理excel文本极好的，而且百度知道上的截取字段到execl的程序也用到了xlwt，就度娘到xlwt的下载地址：

https://pypi.python.org/pypi/xlwt/#downloads

此地址如果不容易下的话可到百度盘下载：

http://pan.baidu.com/s/1mg8ED2g 里面是xlwt-1.0.0

当时搜到百度知道作为参考的程序地址找不到了，贴下他的部分程序：

#!/usr/bin/pythonimport xlwtwb = xlwt.Workbook()ws = wb.add_sheet('shujue')f = open(r'e:\shuju.txt')x = f.readline()y = x.split()print (y)

上面是读取一行shuju.txt里面的内容，然后以行里面的空格分割成几个字串，然后组成一个list就是y，然后把y打印出来，有参考了xlwt下载页面的Quick Start：

import xlwtfrom datetime import datetimestyle0 = xlwt.easyxf('font: name Times New Roman, color-index red, bold on',    num_format_str='#,##0.00')style1 = xlwt.easyxf(num_format_str='D-MMM-YY')wb = xlwt.Workbook()  #？ws = wb.add_sheet('A Test Sheet')  #新建一个execl sheetws.write(0, 0, 1234.56, style0)  #把1234.56以style0的格式放到excel中的第一行的第一列中ws.write(1, 0, datetime.now(), style1)  #把现在的时间以style1的格式放到第二行的第一列中ws.write(2, 0, 1)  #把1放到第三行的第一列中ws.write(2, 1, 1)  #把1放到第三行的第二列中ws.write(2, 2, xlwt.Formula("A3+B3"))  #把第三行的第一列和第二列相加再放到第三行的第三列中wb.save('example.xls') #保存到examle.xls中

结合上面再结合python的一些基础知识，如列表元素的遍历方法，for循环以及一些比较就能完成基本的数据截取。

假设我的shuju.txt的文件中有成对的[]和()将某些数据分割开：如

hell [] tianya dongci daci[] () love me love my doggood morning ()[] see hello to () [] everyaaa () hehe cocos python () [] very goodding ling [] () dingling () ling lingda da de () [] ma ti

我要把把()或[]出现第一次后把后面的数据给截取出来，放到excel中，并要求()和[]起始的要不同编号，程序如下：

#!/usr/bin/pythonimport xlwtstyle0 = xlwt.easyxf('font: name Times New Roman, color-index red, bold on')#红色字体，加粗wb = xlwt.Workbook()ws = wb.add_sheet('A Test Sheet', cell_overwrite_ok=True)  #cell...=True是防止重复操作一个单元格报错f = open(r'e:\shuju.txt')loop = 0  #控制写入execl的行loop_test = 0 #控制以[]开始的出现的次序loop_sub = 0  #控制以()开始出现的次序temp_str = ""  #做缓存的字符串，循环添加空格用到loop_zk = 0  #控制截取字符串的范围for j in range(300):  #txt文件要小于300行    x = f.readline()  #读取一行数据    y = x.split()  #以空格分割为若干字符串    for i in y:        loop_zk += 1  #记录()或[]出现在列表的哪个位置，便于截取后面的数据        if ((i == "[]") or (i == "()")) and (len(y) > loop_zk):  #(len(y)>loop_zk)来保证()和[]后面还有数据            if(i == "[]"):                loop_test += 1                ws.write(loop, 0, loop_test, style0)                for s in y[loop_zk:]:                    temp_str += (s + " ")                    ws.write(loop, 1, temp_str, style0)            elif(i == "()"):                loop_sub += 1                ws.write(loop, 0, loop_sub)                for s in y[loop_zk:]:                    temp_str += (s + " ")                    ws.write(loop, 1, temp_str)                      loop += 1  #excel写入位置移动一行            temp_str = ""  #temp_str清空            break  #找到一个()或[]后就跳出此行的搜索    loop_zk = 0  #()和[]位置清零            wb.save('e:\shuju.xls')  #将数据存到execl中

运行结果如下：

ok~~~~

0 0