pandas入门——数据的创建与基本操作
来源:互联网 发布:js引用本地json文件 编辑:程序博客网 时间:2024/06/07 13:30
数据的创建与基本操作
- 建一个dataframe 使用时间序列为行索引,使用abcdef为列索引
# 导入numpy包以np的形式;导入pandas包以pd的形式import numpy as npimport pandas as pd# 创建一个时间序列dates = pd.date_range("20170813",periods=6)# 创建一个dataframe 使用时间序列为行索引,使用abcdef为列索引df = pd.DataFrame(data=np.random.randint(3, 9,size=(6,6)),index=dates,columns=list(["a","b","c","d","e","f"]))print(df)
a b c d e f2017-08-13 5 3 7 8 8 62017-08-14 3 7 5 3 3 72017-08-15 5 3 8 8 8 52017-08-16 4 3 8 8 3 82017-08-17 6 5 5 4 4 82017-08-18 6 6 4 3 7 5
- 获取每一column的数据类型
print(df.dtypes)
a int32b int32c int32d int32e int32f int32dtype: object
- 获取数据的index
print(df.index)
DatetimeIndex(['2017-08-13', '2017-08-14', '2017-08-15', '2017-08-16', '2017-08-17', '2017-08-18'], dtype='datetime64[ns]', freq='D')
- 获取数据的columns
print(df.columns)
Index(['a', 'b', 'c', 'd', 'e', 'f'], dtype='object')
- 获取数据的所有values
print(df.values)
array([[5, 3, 7, 8, 8, 6], [3, 7, 5, 3, 3, 7], [5, 3, 8, 8, 8, 5], [4, 3, 8, 8, 3, 8], [6, 5, 5, 4, 4, 8], [6, 6, 4, 3, 7, 5]])
- 获取数据的描述信息
print(df.describe())
a b c d e fcount 6.000000 6.000000 6.000000 6.000000 6.000000 6.000000mean 4.833333 4.500000 6.166667 5.666667 5.500000 6.500000std 1.169045 1.760682 1.722401 2.581989 2.428992 1.378405min 3.000000 3.000000 4.000000 3.000000 3.000000 5.00000025% 4.250000 3.000000 5.000000 3.250000 3.250000 5.25000050% 5.000000 4.000000 6.000000 6.000000 5.500000 6.50000075% 5.750000 5.750000 7.750000 8.000000 7.750000 7.750000max 6.000000 7.000000 8.000000 8.000000 8.000000 8.000000
- 对行上的索引进行逆向排序
print(df.sort_index(axis=1,ascending=False))
f e d c b a2017-08-13 6 8 8 7 3 52017-08-14 7 3 3 5 7 32017-08-15 5 8 8 8 3 52017-08-16 8 3 8 8 3 42017-08-17 8 4 4 5 5 62017-08-18 5 7 3 4 6 6
- 对列上的索引进行逆向排序
print(df.sort_index(axis=0,ascending=False))
a b c d e f2017-08-18 6 6 4 3 7 52017-08-17 6 5 5 4 4 82017-08-16 4 3 8 8 3 82017-08-15 5 3 8 8 8 52017-08-14 3 7 5 3 3 72017-08-13 5 3 7 8 8 6
- 对数据进行排序 指定在行上进行排序 并以倒序的形式
print(df.sort_values(by="2017-08-13",axis=1,ascending=False))
d e c f a b2017-08-13 8 8 7 6 5 32017-08-14 3 3 5 7 3 72017-08-15 8 8 8 5 5 32017-08-16 8 3 8 8 4 32017-08-17 4 4 5 8 6 52017-08-18 3 7 4 5 6 6
- 对数据进行排序 指定在列上进行排序 并以倒序的形式
print(df.sort_values(by="e",axis=0,ascending=False))
a b c d e f2017-08-13 5 3 7 8 8 62017-08-15 5 3 8 8 8 52017-08-18 6 6 4 3 7 52017-08-17 6 5 5 4 4 82017-08-14 3 7 5 3 3 72017-08-16 4 3 8 8 3 8
阅读全文
0 0
- pandas入门——数据的创建与基本操作
- Pandas数据基本操作
- pandas入门——数据的读取
- 利用Pandas进行数据分析(2)——pandas数据基本操作
- Pandas的基本操作
- pandas的基本用法(八)——数据的绘制
- pandas的基本用法(二)——选择数据
- Pandas的基本用法(三)——设置数据
- pandas的基本用法(四)——处理缺失数据
- pandas的基本用法(五)——导入导出数据
- pandas的基本用法(六)——合并数据
- pandas的基本用法(七)——合并数据merge
- pandas入门——创建series
- pandas入门——创建dataframe
- pandas入门——多表操作
- Python操作Mysql数据库入门——数据导入pandas(数据分析准备)
- pandas入门——数据分组
- pandas入门——数据转换
- 文本聚类
- Maven3路程(三)用Maven创建第一个web项目(1)
- Oracle中获取系统当前时间 和 进行时间间隔操作
- 表单验证 jquery.validator 和 jquery.validate 的用法
- Android事件分发机制源码解析
- pandas入门——数据的创建与基本操作
- 谷歌扩展的通讯方式
- 剪花布条 【hdu-2087】 【KMP】
- Dubbo的注册中心 官方推荐zookeeper
- ubuntu安装docker以及dockerfly
- JavaWeb-ssh框架搭建
- zcmu-1957
- sql server 2008 r安装
- Linux MPLS 总结