Python数据分析库Pandas教程——简介
来源:互联网 发布:linux安装libssl dev 编辑:程序博客网 时间:2024/06/06 18:19
Pandas是基于Python的高性能数据分析工具,非常容易上手。
Pandas安装
推荐使用Conda安装(尤其是在Windows下)
- 使用Conda安装:
- 安装anaconda
- 进入anaconda命令行,conda create -n py27 python=2.7
conda install pandas
- 使用PIP安装:
- 安装pip,如果是Ubuntu,可以用
sudo apt-get install python-pip
安装 sudo pip install pandas
- 安装pip,如果是Ubuntu,可以用
Pandas示例
这里演示用Pandas处理一个简单的CSV文件。
文件下载地址:bikes.csv
文件的前几行如下:
Date;Berri 1;Brébeuf (données non disponibles);Côte-Sainte-Catherine;Maisonneuve 1;Maisonneuve 2;du Parc;Pierre-Dupuy;Rachel1;St-Urbain (données non disponibles)01/01/2012;35;;0;38;51;26;10;16;02/01/2012;83;;1;68;153;53;6;43;03/01/2012;135;;2;104;248;89;3;58;04/01/2012;144;;1;116;318;111;8;61;05/01/2012;197;;2;124;330;97;13;95;06/01/2012;146;;0;98;244;86;4;75;07/01/2012;98;;2;80;108;53;6;54;08/01/2012;95;;1;62;98;64;11;63;
代码:
#coding=utf-8
import pandas as pdpd.set_option('display.mpl_style', 'default') # 设置风格
import requestsimport codecscsv_text = requests.get("https://raw.githubusercontent.com/jvns/pandas-cookbook/master/data/bikes.csv").text # 下载CSV文件with codecs.open("bikes.csv", "w", "utf-8") as f: f.write(csv_text)
df = pd.read_csv('bikes.csv', sep=';', encoding='latin1', parse_dates=['Date'], dayfirst=True, index_col='Date')df[:3] # 获取前三行数据,在Python代码中需要加上print来显示
df['Berri 1'] # 根据列名获取一列数据
Date2012-01-01 352012-01-02 832012-01-03 1352012-01-04 1442012-01-05 1972012-01-06 1462012-01-07 982012-01-08 952012-01-09 2442012-01-10 3972012-01-11 2732012-01-12 1572012-01-13 752012-01-14 322012-01-15 542012-01-16 1682012-01-17 1552012-01-18 1392012-01-19 1912012-01-20 1612012-01-21 532012-01-22 712012-01-23 2102012-01-24 2992012-01-25 3342012-01-26 3062012-01-27 912012-01-28 802012-01-29 872012-01-30 219 ... 2012-10-07 15802012-10-08 18542012-10-09 47872012-10-10 31152012-10-11 37462012-10-12 31692012-10-13 17832012-10-14 5872012-10-15 32922012-10-16 37392012-10-17 40982012-10-18 46712012-10-19 13132012-10-20 20112012-10-21 12772012-10-22 36502012-10-23 41772012-10-24 37442012-10-25 37352012-10-26 42902012-10-27 18572012-10-28 13102012-10-29 29192012-10-30 28872012-10-31 26342012-11-01 24052012-11-02 15822012-11-03 8442012-11-04 9662012-11-05 2247Name: Berri 1, Length: 310, dtype: int64
df['Berri 1'].plot() # 绘制一列的统计图
可加QQ群426491390讨论机器学习、数据挖掘等相关知识。
阅读全文
0 0
- Python数据分析库Pandas教程——简介
- python数据分析系列教程——Pandas全解
- Python——数据分析Pandas入门
- python数据分析系列教程——python(pandas)读写csv文件
- Python数据分析笔记——Numpy、Pandas库
- python数据分析---Pandas
- Python 数据分析 pandas
- python数据分析复盘——数据分析相关库之Pandas
- Python中的结构化数据分析利器-Pandas简介
- Python中的结构化数据分析利器-Pandas简介
- 利用python进行数据分析——pandas
- Python数据分析基础(三)——pandas
- Python数据分析常用手册——Numpy和Pandas
- Python数据分析利器——pandas简单教学
- Python点滴(三)—pandas数据分析与matplotlib画图
- Python点滴(三)—pandas数据分析与matplotlib画图
- 基于python的数据分析库Pandas
- Python数据分析库pandas基本操作
- http://makaidong.com/crsky/293014_1118729.html
- 机器学习故事汇-梯度下降
- 【网络基础 四】网络层
- 论文笔记:Deep Residual Learning for Image Recognition
- kerberos认证原理---讲的非常细致,易懂
- Python数据分析库Pandas教程——简介
- Git之常见异常收集
- autoit pro
- Eclipse-复制项目存在的问题及解决方案
- SVN 新文件 不能commit
- JAVA之BigInteger
- java 重写equals方法
- Putty工具连接用务器
- 【网络基础 五】运输层