数据预处理的python实现

来源:互联网 发布:java stack overflow 编辑:程序博客网 时间:2024/06/05 21:11

1、归一化

1.1简单处理列表

#归一化处理raw = [0.07, 0.14, 0.07]  norm=[float(i)/max(raw) for i in raw]print(norm)

1.2 处理嵌套列表:

#归一化处理raw = [[0.07, 0.14, 0.07],[1,2, 3]]norm=[]for i in range(len(raw)):    norm.append([float(j)/max(raw[i]) for j in raw[i]])print(norm)

2、查看字符串数据

一些csv文件读取的数据,往往是数字和字符串混在一起的,如何string类型的数据不多,可以通过以下代码来查看:

##Counter(X.dtypes.values)X.select_dtypes(include=['O']).columns
原创粉丝点击