大众点评数据分析

来源:互联网 发布:网络网警电话是多少 编辑:程序博客网 时间:2024/05/01 20:35

大众点评数据分析


开通专栏的第一篇文章,这是前些日子做的关于tableau可视化的一个东西,感谢路人甲提供的数据。今天写这篇文章也是为了记录自己在学习tableau的过程,不然过着过着,总感觉自己什么东西都没留下。

这个数据是大众点评网上的一些数据,这篇文章主要使用tableau对这些数据进行分析,以期望能从中发现一些有用的东西。

    • 大众点评数据分析
      • 一商家与美食
        • 城市分布
        • 商家数量
        • 城市商家数量和美食类型
      • 二人均消费
        • 最钟爱的美食类型
        • 人均消费和评价指数
        • 人均消费和综合指数
      • 三三种指数
        • 口味指数和环境指数关系
        • 三个指数
        • 评价数量和评价指数

一、商家与美食

1.城市分布

城市在地图上的分布,可以看到我国南北方的城市均有统计,数据可信度还是比较高的。图中颜色越深的,说明平均消费水平越高,明显的,北京、上海依然遥遥领先其他城市。当然、这个图形看上去并不是特别的直观,我们就做了下一个图表以更加清晰的方式解读消费水平的差异。

2.商家数量

上图反应的是大众点评上一二线城市,美食商家入驻平台的数量。北京、上海、深圳分别位列前三,这也说明了020发展模式在这些较发达城市有着更高活跃度,发展规模也较大。

商家数量平均值为11万家。

3.城市商家数量和美食类型

城市. 颜色显示 美食类型计数 不同计数。 大小显示 记录数 总计。 标记按 城市 进行标记。

树状图大小表示城市美食数量,颜色深浅代表该城市美食种类的数量。天津的商家虽未进前五,但是美食种类却位列第二。

二、人均消费

1.最钟爱的美食类型

平常写Python爬虫做数据分析的时候,习惯做个词云图,这在tableau里面就比较简单了。


看来面包甜点、火锅、西餐是大家的最爱嘛。

2.人均消费和评价指数

每个 美食类型 的 平均值 人均消费 与 平均值 评价指数。 颜色显示有关 平均值 人均消费 与 平均值 评价指数 的详细信息。

该图反映的是人均消费和评价指数的关系,从图中可以看到几个特殊的条形图,分别是小吃、面包和面食,这三者的消费金额虽然不高,但是评价指数却远超人均消费水平。

3.人均消费和综合指数


从双轴图中可以看到,人均消费高的美食和其评分并不呈现正相关关系,说明对于美食而言,并不是越贵的越好。比如对于北京而言,火锅可谓是受到普遍人群的喜爱,评分居于第一位。

三、三种指数

1.口味指数和环境指数关系

美食类型 的 平均值 口味指数 与 平均值 环境指数 的趋势。

从图中可以筛选出两个点,其中本帮江浙菜和日本菜评分都很高,
除此之外,从图中双轴折现图中可以看出,基本上口味指数和环境指数呈现正相关趋势。这能不能说明环境对顾客的食欲有促进作用呢?

2.三个指数

通过上一张图,进一步对四种指数进行分析。
折线图表示口味、服务和环境指数,三者基本上呈现正相关关系。

同时,将评价指数放进来,可以发现,尽管有些美食的三指数很高,但是顾客的评价分数却不高。

3.评价数量和评价指数

每个 美食类型 的 评价数量 总计 与 评价指数 平均值。 对于窗格 评价数量 总计: 颜色显示有关 城市 的详细信息。 对于窗格 评价指数 平均值: 标记按 评价指数 平均值 进行标记。

火锅看来是全国人民的最爱了。
同时通过评价数量可以看出评价指数的可信程度,评价技术越大,可信度越高。
也可以看到,有些菜品属于小众菜,虽然评价数量少(可相当于销售量较少),但是评价却不低。


第一次写tableau的分析文章,文笔不好,多多见谅,目前作者也是处于学习阶段,记录过程,与君共进。在学习tableau的过程,发现网上关于tableau的文章还是比较少的,所以未来有打算抽时间写个tableau作图的基本教程,以避免新手快速上手tableau。

如有建议,欢迎讨论
如有问题,还望批评指正。

个人博客:大众点评数据分析

原创粉丝点击