小问题积累

来源:互联网 发布:windows系统快捷键设置 编辑:程序博客网 时间:2024/05/16 23:56

sample(x,size,replace=F)

x可以是任何​对象,

size规定了从对象中抽出多少个数,size应该小于x的规模,否则会报错

replace默认是F,表示每次​抽取后的数就不能在下一次被抽取;T表示抽取过的数可以继续拿来被抽取

问题二:
今天把一个列表转换成字符串输出的时候出现了UnicodeEncodeError: 'ascii' codec can't encode characters in position 32-34: ordinal not in range(128)问题,使用的是ulipad编译器。

解决方法1:
在开头加上
import sys
reload(sys)
sys.setdefaultencoding( "utf-8" )
问题三:
不知道为什么读csv文件是显示list的index越界,用这种方法可以读写。但是并没有实现我想要的提取某一列。
import sys
import csv
reload(sys)sys.setdefaultencoding( "utf-8" )filename='AmazonRaisin.csv'with open (filename,"rb")as f:    reader=csv.reader(f)    reviews=[]    #将csv文件读进来,这种评论数据不同于数值型数据    for review in f.readlines():        review=review.strip()        review=review.decode("gbk")        reviews.append(review)    for i in range(5):        print reviews[i]    fp=open('writeCsvtoText.txt','w')    for review in reviews:        fp.write(str(review))

问题四:

如何批量替换WORD文档里的时间格式文本

(Ctrl+H就是替换)把查找内容换成([0-9]{4})-([0-9]{1,2})-([0-9]{1,2}) ([0-9]{2}):([0-9]{2}),其中([0-9]{4})代表的是年份这种四位数文本,([0-9]{1,2})代表的是月份,日期,时间这种两位数的文本。当然要按照你要替换的源文件的格式,是以杠链接还是按照年月日链接的,最重要的是要勾选选项里面的“使用通配符”
0 0
原创粉丝点击