数据可视化
来源:互联网 发布:js random 1 100 编辑:程序博客网 时间:2024/05/17 01:23
import pandas as pd#import zipfileimport matplotlib.pyplot as pl#z = zipfile.ZipFile('../input/train.csv.zip')#print(z.namelist())train = pd.read_csv(open(r'C:\Users\lujinyu\Desktop\atae-lstm\atae-lstm\data\train.csv'), parse_dates=['Dates'])train['Year'] = train['Dates'].map(lambda x: x.year)train['Week'] = train['Dates'].map(lambda x: x.week)train['Hour'] = train['Dates'].map(lambda x: x.hour)print(train.head())train.PdDistrict.value_counts().plot(kind='bar', figsize=(8,10))pl.savefig('district_counts.png')train['event']=1weekly_events = train[['Week','Year','event']].groupby(['Year','Week']).count().reset_index()weekly_events_years = weekly_events.pivot(index='Week', columns='Year', values='event').fillna(method='ffill')#%matplotlib inlineax = weekly_events_years.interpolate().plot(title='number of cases every 2 weeks', figsize=(10,6))pl.savefig('events_every_two_weeks.png')hourly_events = train[['Hour','event']].groupby(['Hour']).count().reset_index()hourly_events.plot(kind='bar', figsize=(6, 6))pl.savefig('hourly_events.png')hourly_district_events = train[['PdDistrict','Hour','event']].groupby(['PdDistrict','Hour']).count().reset_index()hourly_district_events_pivot = hourly_district_events.pivot(index='Hour', columns='PdDistrict', values='event').fillna(method='ffill')hourly_district_events_pivot.interpolate().plot(title='number of cases hourly by district', figsize=(10,6))pl.savefig('hourly_events_by_district.png')
阅读全文
0 0
- 【可视化】数据图表可视化
- 数据可视化
- 数据可视化
- 数据可视化
- 数据可视化
- 数据可视化
- 数据可视化
- 数据可视化
- 数据可视化
- 数据可视化
- 数据可视化
- 数据可视化
- 数据可视化
- 数据可视化
- 数据可视化
- 数据可视化
- 数据可视化
- 数据可视化
- Matlab中 imadjust函数用法
- 小学期 异形:达达学长的生死逃亡
- 64位电脑通过串口发送数据到硬件
- 罗振宇送给新员工的四句话
- OpenGL从1.0开始--OpenGL显示表(上)
- 数据可视化
- Java面向接口编程的好处
- 编写一个程序 -8
- Java4Android笔记之Java中的面向对象基础(一)
- 学习笔记4
- 周志华《机器学习》学习笔记——Logistic回归
- hadoop入门七(搭建环境)
- 递归程序
- 1027 Ignatius and the Princess II