我的python学习笔记2
来源:互联网 发布:wampserver域名重定向 编辑:程序博客网 时间:2024/04/28 16:03
在工作里,有一个文件里的汉字是多余的,由于数据量很大(几千甚至上万)行数据,并且不一定每行都有汉字,所以想到了用python处理剔除行内汉字。
由于数据是每行用逗号(",")分隔的,且汉字只会出现在固定的位置,所以就想到了用csv标准模块处理。
由于csv.reader读取到的结果是一个list,然后再提出汉字后写入到新文件,而csv.writer的写结果会在每行末添加两个\r,不符合输出要求,所以用python自带的文件写入函数。
下边是list类型与string类型数据转换函数:
其中
isinstance(x,list)
是判断x是否为list类型数据的判断函数。
##def list2strbyCSV:list转换成字符串string型(CSV):def list2strbyCSV(listlist,que=','): """输入list参数,que是用以区分list元素分隔符""" stri = '' for x in listlist: if not isinstance(x,list): stri = stri + str(x)+que else: stri = stri + list2strbyCSV(x,que) + que return stri[:-1]##def str2listbyCSV:string转换成list类型(CSV):def str2listbyCSV(str,que=','): listq=[] temp='' for x in str: if x <> que: temp += x else: listq.append(temp) temp='' listq.append(temp) return listq
0 0
- 我的python学习2笔记
- 我的python学习笔记2
- 我的Python学习笔记
- 我的python学习笔记
- 我的python学习笔记
- 我的python学习笔记(2) - GDAL与Python
- 我的python学习笔记1
- 我的python学习笔记3
- 我的python学习笔记4
- 我的python学习笔记(1)
- 我的python快速学习初级笔记
- 我的Python学习笔记(一)
- 我的python学习笔记(二)
- 我的python学习笔记(三)
- 我的python学习笔记.1
- 我的python学习笔记.遍历字典
- 我的python学习笔记.嵌套
- 我的python学习笔记.函数
- Git使用笔记
- LeetCode OJ 之 Insert Interval (插入区间)
- pat1023
- vs 提示图标的含义
- 《MonkeyRunner原理剖析》第九章-MonkeyImage实现原理 - 第五节 - 图片处理基类ChimpImageBase
- 我的python学习笔记2
- Interconnect - POJ 3156 期望+状压dp
- 云计算设计模式翻译(五):Compute Resource Consolidation Pattern
- java并发编程-限时任务
- POJ1511 Invitation Cards【SPFA】
- 《MonkeyRunner原理剖析》第九章-MonkeyImage实现原理 - 第六节 - 截屏图片处理类AdbChimpImage
- Dell 1628S WIN8.1 安装Ubuntu 14.04教程
- 理解Shared Pool 1
- 关键字volatile的含意