python数据挖掘02--pandas基础
来源:互联网 发布:网络语言稳是什么意思 编辑:程序博客网 时间:2024/06/06 04:29
一.pandas引入
from pandas import Series,DataFrameimport pandas as pd
二.pandas的数据结构
1.Series
Series是一种类似一维数组的对象,他由一组数据(各种Numpy数据类型)以及一组与之相关的数据标签(即索引)组成。
obj = Series([4,7,-5,3])obj0 41 72 -53 3左边是索引,右边是值。
可以通过Series的values和index属性获取其数组表示形式和索引对象。
In [1]: obj.valuesOut[1]: array([4,7,-5,3])In[2]:obj.indexout[2]:Int64Index([0,1,2,3])自建标记索引:
In[8]:obj2 = Series([4,7,-5,3],index=['d','b','a','c']out:d 4 b 7 a -5 d 3可以通过索引取Series中的单个值或一组值:
In: obj2['a']Out: -5In: obj2[['c','a','d']]Out: c 3a -sd 4运算
obj2[obj2>0]obj2*2np.exp(ob2)通过python字典创建Series:
sdata = {'Ohio':35000,'Twxas':200,}obj3=Series(sdata)
In:states = ['California','Ohio','Oregon','Texas'] obj4=Series(sdata,index=states)Out:California NaNOhio 35000Oregon 16000Texas 71000寻找缺失数据
pd.isnull(obj4)pd.notnull(obj4)
obj4.isnull()Series对象本身及其索引都有一个name属性。
obj4.name = 'population'obj4.index.name = 'state'2.Dataframe
表格型数据结构,含有一组有序的列,每列可以是不同类型。
构建DataFrame:
data = {'state':['O','P','Q'], 'year':[2000,2001,2005], 'pop':[1.5,1.7,1.2]}frame=DataFrame(data)
frame['state']frame.year使用位置访问:
frame.ix['three']
赋值
frame['debt']=16.5
阅读全文
0 0
- python数据挖掘02--pandas基础
- python数据挖掘包Pandas基本操作
- 【Python数据挖掘】实用模块之Pandas
- python/pandas数据挖掘 groupby,聚合
- Python 数据分析-pandas 基础
- python 数据挖掘基础 入门
- Python数据挖掘学习02--numpy和pandas模块基本使用
- 利用python中的pandas,sklearn进行数据挖掘 basic_of_datamining
- Python 数据分析包:pandas 基础
- Python 数据分析包:pandas 基础
- Python 数据分析包:pandas 基础
- Python 数据分析包:pandas 基础
- Python 数据分析:pandas 操作基础篇
- Python 数据分析包:pandas 基础
- Python 数据分析包:pandas 基础
- Python 数据分析包:pandas 基础
- Python数据分析包:pandas 基础
- python基础数据分析--pandas(一)
- JavaSE-P6随机数,集合,String,StringBuffer
- 单利模式的设计及详细说明
- 网络七层协议
- Hadoop学习——Hadoop集群搭建笔记
- 购物车功能【CI实现】
- python数据挖掘02--pandas基础
- python批量命名文件
- 艾伦图灵——计算机科学之父
- 智能小车46:最小系统Atmega328p的中断实验
- while循环语句的使用
- 网络工程之IP地址,子网掩码,默认网关,DNS服务器形象解释
- LeetCode-Integer to Roman
- MQTT协议在物联网中的应用
- (3)假设程序运行时输入123456