为什么不能在高速上倒车?

来源:互联网 发布:青少年儿童 vb可以吃 编辑:程序博客网 时间:2024/04/28 00:53

有人问你:为什么不能在高速上倒车?

你会说:因为在高速上倒车会有生命危险。


这样的原因让人无法信服,你得给出一个让人信服的结论,于是你采集2016年整年的交通事故相关的信息得出:因为在高速上倒车导致交通事故的有500万起,这样你就有点害怕了,再进一步因为倒车引发的事故中死亡率高达90%,现在是不是觉得在高速上倒车很危险了?当然,这个数据是我编的


上面是一个简单的数据分析的例子,同样还有:华为有雇佣大量水军吗?豆瓣电影评分有水军吗?为什么大家喜欢路人甲的文章?等等~


通过数据分析,你的言论更加让人信服。那么,如何在业余在工作之余学习数据分析呢?我用了五个小时在知乎写的一个回答,这个回答在短短12小时之内获得了1779赞同以及2694次收藏,现在发在公众号上面,因为文章中会有一些超链接公众号不支持外链,所以想看超链接的内容请点击阅读原文


以下方法仅适用开发出身或有语言基础的同学。


我的情况跟题主是一样的,软件工程出身,在之前一直在做Java/Python开发,无意之中接触到了爬虫,接触了一堆一堆的数据,之后慢慢开始对数据感兴趣,开始学习一些数据分析的技能:凭着爬虫以及数据分析的技能我找到了理想中的数据分析岗位。所以我对自己的评价一直是:科班出身的软件工程师、野路子的数据分析师。


从Java/Python开发到Python爬虫到数据分析,有很多人是看着我一步一步走过来的,我想在这里根据我自己这段野路子的学习经历说一说非科班如何利用业余时间学数据分析,当然只是数据分析,不是数据挖掘。


数据分析师的能力分为:分析能力和业务能力, @邹昕 大神说:分析能力决定一个数据分析师的下限,业务能力决定一个数据分析师的上限。


因为是开发出身,我的方法与其他人的不同,

我把数据分析的学习分为两个大的阶段,:


学习的第一阶段:这一阶段是为了培养自己做分析的能力

第一阶段的基础是要有数据

分析能力相对来说是死板的,通常你需要学会掌握下面这些技能:

  • 数据分析常用哪些算法?

  • 需要用哪些库?

  • 如何进行计算?

  • 进行可视化,每一种图表的用途是什么?


为了解决上面抛出的问题,你可以仔细学习阅读下面的书籍:

1. 利用Python进行数据分析 (豆瓣)

2. SciPy and NumPy (豆瓣)


当然,如果你不想用Pyhton用R去搞这么复杂的计算,那你也可以直接把清理好的数据扔在一些做计算和可视化的工具里,我比较熟悉的就是:Tableau,以及据说不错的Power BI.当然最后你发现还是学习Python或者R的数据分析库来的实在,因为他们更加灵活。


在第一阶段用工具结合Python我留下了一些文章,可以作为参考,这些都是在爬虫抓了很多数据之后,先有数据后结合教程书籍分析学习产生的内容。

1. 豆瓣读书分析报告

2. 爬取6.6w+豆瓣电影之后的分析故事


学习的第二阶段:这一阶段是为了培养自己做业务的能力

在第一阶段的学习你已经学会了:

  • 对数据的整体感知

  • 知道什么时候该用什么图表

  • 掌握了一些基本的算法和分析库


这一阶段,技术不再是你的障碍,重点是要有IDEA

这一阶段数据分析的步骤通常为:

  • 我想要做什么?分析什么?

  • 是否有数据能提供支持?把你想做的抽象成数据。

  • 数据获取/数据清洗

  • 开始进行分析(语言、工具)


我们能看到这四个步骤后两个步骤是在第一阶段学习的内容,所以我们只要把精力聚焦在前两个步骤就可以了,那么怎样培养自己数据分析的IDEA,我的方法是:多学多看多做。


多看:看一些实战IDEA较多的书籍

1. 数据之美 (豆瓣)

2. 啤酒与尿布 (豆瓣)

3. 深入浅出数据分析 (豆瓣)


多做:

网络上有很多数据分析的案例,很简单易懂,在深层的技术点也不难,你完全可以按照他的思路重新做一遍,就变成了你的思路了。

数据冰山的数据分析文章:

1. 生活中的数据犀利哥之一:开篇及选车

2. 生活中的数据犀利哥之二:排队

3. 生活中的数据犀利哥之三:找座

4. 生活中的数据犀利哥之四:看趋势

5. 生活中的数据犀利哥之五:找错因果关系

6. 生活中的数据犀利哥之六:快递员送货

7. 北上广深哪里过得更潇洒

8. 沧海横流,看行业起伏(2015年)

9. 和颐事件之后: 怎么定酒店更有安全感?


还有我曾经写的几篇文章:

1. 如何判断一场知乎live的质量?

2. 华为闪存门背后的水军

3. 知乎的高质量用户在流失吗?


团支书的一些回答和文章:

1. 怎样才能以最少的钱租个靠近地铁的房子?

2. 「上海富了周围,北京坑了周围」?

3. 如何不吹牛地形容北京有多大?


等等几位的文章都可以用来学习参考。


通过以上数据分析算是入门了,至于如何进阶,我也在摸索中,希望有机会我可以更新在公众号里面,也欢迎在学习数据分析的同学一起交流。


所以,谁能告诉我为什么不能在高速上倒车?

原创粉丝点击