Pandas数据规整
来源:互联网 发布:java 数组长度属性 编辑:程序博客网 时间:2024/05/16 15:52
Pandas数据规整
数据分析和建模方面的大量编程工作都是用在数据准备上的,有时候存放在文件或数据库中的数据并不能满足数据处理应用的要求
Pandas提供了一组高级的、灵活的、高效的核心函数和算法,它们能够轻松地将数据规整化为你需要的形式
合并
连接
Pandas提供了大量方法,能轻松的对Series,DataFrame和Panel执行合并操作
连接pandas对象 .concat()
import numpy as npimport pandas as pddf = pd.DataFrame(np.random.randn(10, 4))df.head()
pieces = [df[:2], df[3:5], df[7:]] # 这里面切片是前闭后开的pieces
[ 0 1 2 3 0 0.231308 1.193636 -0.033288 0.826399 1 -0.421474 -0.618510 -1.266325 -0.439435, 0 1 2 3 3 -1.197750 -0.446579 0.495728 0.900704 4 -0.638926 -0.233019 -1.106248 -0.762133, 0 1 2 3 7 -0.265515 -0.705797 0.695531 -0.257374 8 0.552615 -0.137180 0.859215 -0.853752 9 -1.014105 0.392409 -1.832748 0.612679]
df2 = pd.concat(pieces)df2
追加 .append()
df = pd.DataFrame(np.random.randn(4, 4), columns=['A','B','C','D'])df
s = df.iloc[2]s
A 1.696282B -1.272457C 1.226460D -1.944458Name: 2, dtype: float64
df.append(s, ignore_index=True)
分组
group by()
:一般指以下一个或多个操作步骤
- Splitting 将数据分组
- Applying 对每个分组应用不同的function
- Combining 使用某种数据结果展示结果
df = pd.DataFrame({ 'A' : ['foo', 'bar', 'foo', 'bar','foo', 'bar', 'foo', 'foo'], 'B' : ['one', 'one', 'two', 'three','two', 'two', 'one', 'three'], 'C' : np.random.randn(8), 'D' : np.random.randn(8) })df
# 分组后sum求和:a = df.groupby('A').sum()a
a = df.groupby('A',as_index=False).sum()a
# 对多列分组后sum:b = df.groupby(['A','B']).sum()b
b = df.groupby(['A','B'],as_index=False).sum()b
阅读全文
0 0
- pandas 数据规整
- pandas数据规整化
- Pandas数据规整
- pandas小记:pandas数据规整化-缺失和冗余数据处理
- pandas小记:pandas数据规整化-分组合并及重塑
- 数据规整
- 数据挖掘-数据规整
- 数据规整化
- 数据规整化
- 第七章:数据规整化
- pandas小记:pandas数据输入输出
- 数据规整化:清理,转换,合并,重塑
- 数据规整化:清理、转换、合并、重塑
- 数据规整化:清理、转换、合并、重塑
- 第三章 python数据规整化
- 数据规整化:清理、转换、合并、重塑
- 数据规整化:清理、转换、合并、重塑
- 2015-03-18-数据规整化(1)-合并数据集
- 简单的小清新表单登录注册页面~~
- Hadoop小文件问题及解决方案
- LintCode 关于回溯算法的总结
- 使用qrcode生成二维码
- 浅谈HTTP中Get与Post的区别
- Pandas数据规整
- thymeleaf框架通过java渲染html生成pdf
- Longest Increasing Path in a Matrix
- coreutils源码学习之——mkdir.c
- Codeforces Round #439 (Div. 2)
- 关于thinkphp5.0 rc4.0扩展类库自动与手动加载的问题
- 数据库事务的复习笔记
- Java正则表达式与IO流简单练习
- 不要只怀揣梦想,而是要努力实现梦想!