对ch08.csv-消费账单进行简单的分析及可视化

来源:互联网 发布:非诚勿扰网络报名 编辑:程序博客网 时间:2024/04/29 01:44
#需要研究的内容
男性和女性的小费
去吃饭的人数对小费的影响
男女抽烟的人数和所占比例--禁烟对餐厅消费有正向/负向影响
抽烟的人和不抽烟的人,谁消费水平更高

周末用餐人数较多?
午餐和晚餐 平时和周末 卖出数量比较
午餐和晚餐 平时和周末 人均消费水平 小费水平

男女比例---这家餐厅是男性口味还是女性口味--需要更多数据

代码:
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

tips = pd.readcsv('tips.csv')

party_counts = pd.crosstab(tips.day,tips.size)
///
周几 几个人的台子开了几个
In [11]: party_counts
Out[11]:
size  1   2   3   4  5  6
day
Fri   1  16   1   1  0  0
Sat   2  53  18  13  1  0
Sun   0  39  15  18  3  1
Thur  1  48   4   5  1  3
发现一人台和6人台都很少,于是切片:
///
party_counts=party_counts.ix[:,2:5]
///
In [13]: party_counts
Out[13]:
size   2   3   4  5
day
Fri   16   1   1  0
Sat   53  18  13  1
Sun   39  15  18  3
Thur  48   4   5  1
把1人台和6人台的去掉并作图
///
party_counts.plot(kind = 'bar')

///


进行规格化,使各行和为1
///
party_pcts = party_counts.div(party_counts.sum(1).astype(float),axis = 0)
发现周末的聚会规模变大

我们再来生成“小费占总消费比值”的图
tips['tip_pct']= tips['tip']/tips['total_bill']
tips['tip_pct'].hist(bins = 50)//直方图
tips['tip_pct'].plot(kind = 'kde')//KDE图









0 0