小问题积累

来源：互联网发布：windows系统快捷键设置编辑：程序博客网时间：2024/05/16 23:56

sample(x,size,replace=F)

x可以是任何对象，

size规定了从对象中抽出多少个数，size应该小于x的规模，否则会报错

replace默认是F，表示每次抽取后的数就不能在下一次被抽取；T表示抽取过的数可以继续拿来被抽取

问题二：

今天把一个列表转换成字符串输出的时候出现了UnicodeEncodeError: 'ascii' codec can't encode characters in position 32-34: ordinal not in range(128)问题，使用的是ulipad编译器。

解决方法1：

在开头加上

import sys

reload(sys)

sys.setdefaultencoding( "utf-8" )

问题三：

不知道为什么读csv文件是显示list的index越界，用这种方法可以读写。但是并没有实现我想要的提取某一列。

import sys

import csv

reload(sys)sys.setdefaultencoding( "utf-8" )filename='AmazonRaisin.csv'with open (filename,"rb")as f:    reader=csv.reader(f)    reviews=[]    #将csv文件读进来，这种评论数据不同于数值型数据    for review in f.readlines():        review=review.strip()        review=review.decode("gbk")        reviews.append(review)    for i in range(5):        print reviews[i]    fp=open('writeCsvtoText.txt','w')    for review in reviews:        fp.write(str(review))

问题四：

如何批量替换WORD文档里的时间格式文本

（Ctrl+H就是替换）把查找内容换成([0-9]{4})-([0-9]{1,2})-([0-9]{1,2}) ([0-9]{2}):([0-9]{2})，其中([0-9]{4})代表的是年份这种四位数文本，([0-9]{1,2})代表的是月份，日期，时间这种两位数的文本。当然要按照你要替换的源文件的格式，是以杠链接还是按照年月日链接的，最重要的是要勾选选项里面的“使用通配符”。

0 0