pandas入门

来源:互联网 发布:windows优化大师8.0 编辑:程序博客网 时间:2024/06/05 00:09

给大家介绍一个数据分析的大杀器——pandas。

pandas是基于Python的科学计算模块NumPy构建的含有更高级数据结构和工具的数据分析包,可以帮助我们更快更方便的进行数据处理操作,使用Pandas可处理亿级数据哦。

一、安装和引入pandas

安装:pip install pandas

引入:from pandas import series,dataframe


二、数据结构

pandas有两种主要的数据结构:Series和DataFrame。

1、Series

Series由一组数据及与之相关的索引组成。

(1)由一组数据创建最简单的Series


Series的表现形式:左边为索引,右边为值。索引未指定时,自动创建0到N-1。

(2)指定索引创建Series


对Series人工指定了索引,可以通过索引来获取Series中的值。

(3)通过字典创建Series


(4)通过索引或切片获取Series中的值


2、DataFrame

DataFrame可以理解为有序的二维列表,既有行索引,也有列索引。

(1)直接传入等长的列表或NumPy数组组成的字典构造DataFrame


可见,由于Python字典是无序的,传入DataFrame之后的值却依然是一一对应的。字典的键为列索引,行索引自动添加。

(2)指定行索引与列索引


这样,列索引和行索引就被指定了。

(3)通过DataFrame一列获取一个Series


使用类似字典的取值或属性这两种方式均可。

(4)筛选索引DataFrame中的数据


这样就可以得到你想要的数据了,是不是很方便呢。

1 0
原创粉丝点击