我的python学习笔记2

来源:互联网 发布:wampserver域名重定向 编辑:程序博客网 时间:2024/04/28 16:03

在工作里,有一个文件里的汉字是多余的,由于数据量很大(几千甚至上万)行数据,并且不一定每行都有汉字,所以想到了用python处理剔除行内汉字。


由于数据是每行用逗号(",")分隔的,且汉字只会出现在固定的位置,所以就想到了用csv标准模块处理。

由于csv.reader读取到的结果是一个list,然后再提出汉字后写入到新文件,而csv.writer的写结果会在每行末添加两个\r,不符合输出要求,所以用python自带的文件写入函数。

下边是list类型与string类型数据转换函数:

其中

isinstance(x,list)

是判断x是否为list类型数据的判断函数。

##def list2strbyCSV:list转换成字符串string型(CSV):def list2strbyCSV(listlist,que=','):    """输入list参数,que是用以区分list元素分隔符"""    stri = ''    for x in listlist:        if not isinstance(x,list):            stri = stri + str(x)+que        else:            stri = stri + list2strbyCSV(x,que) + que    return stri[:-1]##def str2listbyCSV:string转换成list类型(CSV):def str2listbyCSV(str,que=','):    listq=[]    temp=''    for x in str:    if x <> que:    temp += x    else:    listq.append(temp)    temp=''    listq.append(temp)    return listq


0 0
原创粉丝点击