利用pandas对数据进行基本清洗
来源:互联网 发布:matlab数组的转置 编辑:程序博客网 时间:2024/04/30 06:40
首先贴上两个介绍python中pandas库的链接pandas简单数据处理、十分钟搞定pandas(英文版)以及网友的简单翻译十分钟搞定pandas(中)
这些内容在初学python处理大数据十分有效。
这次的内容是在给定的数据集对数据作一个简单的z-score的标准化处理,数据集可以自行弄一个怎么样的数据集都行。
我的数据集存放在./bug/下名称分别为1..34.txt。
以下是处理代码
import pandas as pddef main(): for k in range(1,35): filename = "bug/"+str(k)+".csv" csvfile = file(filename,'rb') data = pd.read_csv(csvfile) cols = list(data.iloc[:,1:21].columns) for col in cols: col_zscore = col + "_zscore" data[col_zscore] = (data[col]-data[col].mean())/data[col].std(ddof=0) print data if __name__ == "__main__": main()
0 0
- 利用pandas对数据进行基本清洗
- 如何利用pandas进行数据清洗?
- 利用Python Pandas进行数据预处理-数据清洗
- 利用Python Pandas进行数据预处理-数据清洗
- 利用Python Pandas进行数据预处理-数据清洗
- 使用pandas进行数据清洗
- 使用pandas进行数据清洗
- 利用Python Pandas进行数据预处理-Pandas基本的数据结构
- Pandas 数据处理,数据清洗
- Pandas 数据清洗
- 利用Pandas进行数据分析(2)——pandas数据基本操作
- 利用pandas进行数据预处理
- 使用spyder+pandas清洗数据
- Python Pandas、Spark数据清洗
- 【Pandas-Cookbook】07:数据清洗
- pandas做数据的清洗
- 利用Python 的 Pandas进行数据分析
- 利用pandas进行数据分组及可视化
- Netty5 简单栗子
- IP头、TCP头、UDP头详解以及定义
- ovs-of实现简单的桥
- Android(四)android学习书籍介绍+工具使用介绍
- JS表格组件神器bootstrap table详解
- 利用pandas对数据进行基本清洗
- 互联网协议入门
- 多线程编程指南摘录三:Run Loops(2)
- 进制转换
- java设计模式——组合模式
- android 网络编程Udp、Tcp、Http Socket
- POJ1007: Output Limit Exceeded的解决方法
- 总结 XSS 与 CSRF 两种跨站攻击
- 判断键盘是否显示