pandas做数据的清洗

来源:互联网 发布:917发卡平台源码 编辑:程序博客网 时间:2024/04/28 13:31

    转换之后的经纬度的数据出现很多的问题,重复,特殊值,,,所以我就是做了一个简单的清洗使用 Python里面的pandas。


#coding:utf8import pandas as pdimport numpy as np# import csvdf = pd.read_csv(r'D:\MobileFile\fangjia2.csv', encoding='gbk')#读取房价文件df2 = pd.DataFrame(df)#数据传入df3 = df2.replace(df2[df2['jiage']<2000],np.nan)#找出jiage里面2000以下的数据替换为空df4 = df3.dropna(how='any')#删除为空值的行df5 = df4.drop_duplicates()#去重print df5.duplicated()#显示是否重复df5.to_csv(r'D:\MobileFile\fangjia5.csv',encoding='utf-8')#存储新的csv文件

0 0
原创粉丝点击