Pandas模块1
来源:互联网 发布:python 毫秒级时间戳 编辑:程序博客网 时间:2024/05/21 07:54
常用的两个数据结构:Serious和DataFrame
Serious:表示一维数组
#! /user/bin/env python#encoding=utf-8__author__ = 'chw'import pandas as pdfrom pandas import Series,DataFrameprint Series([1,2,4,5])print Series([1,2,5,6],index=['q','w','s','f'])obj=Series([1,2,5,6],index=['q','w','s','f'])A={'a':1,'b':2,'q':7}print obj.index,obj.get('q'),obj.values,obj[obj>4],dict(obj)print Series(A)print pd.isnull(obj) ,obj+Series(A)
结果:
0 11 22 43 5dtype: int64q 1w 2s 5f 6dtype: int64Index([u'q', u'w', u's', u'f'], dtype='object') 1 [1 2 5 6] s 5f 6dtype: int64 {'q': 1, 's': 5, 'w': 2, 'f': 6}a 1b 2q 7dtype: int64q Falsew Falses Falsef Falsedtype: bool a NaNb NaNf NaNq 8.0s NaNw NaNdtype: float64
DataFrame:表示的表格型结构,它含有一组有序的列,每列可以是不同的值类型(数值,字符串,布尔值等)。其既有行索引也有列索引,它可以看做由Series组成的字典(共用同一个索引)。DataFrame中面向行和面向列的操作基本上是平衡的。
数据类型:连续嵌套的字典
{‘a’:{’s’:1,’d’:2},’b’:{‘e’:3,’r’:4}}
外层字典的键为列,比如’a’,’b’
内层字典的键为行,比如’s’,’d’,’e”r’
#! /user/bin/env python#encoding=utf-8__author__ = 'chw'import pandas as pdfrom pandas import Series,DataFramedata={'state':['Ohio','Ohio','Ohio','Nevada','Nevada'], 'year':[2000,2001,2002,2001,2002], 'pop':[1.5,1.7,1.8,1.9,2.1]}# frame=DataFrame(data)# print frame,frame.get('pop')data1={'a':['1','2'],'b':[201,202],'c':['q','w']}frame1=DataFrame(data1)print DataFrame(data1,columns=['b','c','a'],index=['a','b'])print frame1print frame1.ix[1]
结果:
b c aa 201 q 1b 202 w 2 a b c0 1 201 q1 2 202 wa 2b 202c wName: 1, dtype: object
查看数据
.head(n):前n行数据
.tail(n):后n行数据
.index:表示索引
.columns:表示属性名
.values:表示数据
.T:zhuanzi
.sort():排序
.describe:表示快速统计汇总
选择
虽然标准的Python/Numpy的选择和设置表达式都能够直接派上用场,但是作为工程使用的代码,我们推荐使用经过优化的pandas数据访问方式: .at, .iat, .loc, .iloc 和 .ix
合并
Concat
join
append:将一行连接到一个DataFrame上
分组
对于”group by”操作,我们通常是指以下一个或多个操作步骤:
l (Splitting)按照一些规则将数据分为不同的组;
l (Applying)对于每组数据分别执行一个函数;
l (Combining)将结果组合到一个数据结构中;
参考文献:http://www.cnblogs.com/chaosimple/p/4153083.html
- Pandas模块1
- pandas模块
- Python中的pandas模块
- pandas 模块学习
- python: pandas模块
- pandas 模块学习总结
- Python-pandas模块数据处理
- Pandas模块2
- Python--pandas模块
- pandas模块简明教程
- python模块学习pandas(-)
- pandas 模块学习
- 数据分析模块pandas
- pandas 模块学习
- Python大数据处理模块Pandas
- pandas 1
- Python数据分析模块pandas整理
- 学习Python大数据处理模块Pandas
- 从0~n-1中随机k个有序元素
- 项目沟通管理脉络
- 单链表
- uboot、linux内核打补丁及根文件系统生成
- 各种国内本地源设置
- Pandas模块1
- MFC初学之音乐播放器1_2续
- js中的this问题总结
- python-模块间的导入与os.system('xxx')的shell命令执行
- ajax跨域jsonp并且post请求No 'Access-Control-Allow-Origin'以及执行error时readyState=4同时status=200的解决方法
- 纯CSS3实现动感菜单
- Linux命令基础28-watch命令
- less
- springmvc与mybatis结合