2017.05.17回顾

来源:互联网 发布:大数据工程师做什么 编辑:程序博客网 时间:2024/05/22 14:35

1、写完小结,我记得是10点50,我开始起草招人的要求,先写了一个粗略的要求,没有格式化成普遍的招人格式,然后我去调查那些大数据竞赛的难度和含金量,在知乎和kaggle官网逛了逛,顺便还温习了一个简单的概率问题,独立事件,两个事件同时发生的概率P(AB)=P(A)P(B),和非独立事件,条件概率P(AB)=P(A)P(B|A)

2、下午起床,继续逛知乎和一些大数据平台,了解到kaggle/天池/DC/DF/开赛等大数据竞赛平台,在这些平台去逛了逛,也在知乎上看了一下相关的评论,压力大啊,很多top级的选手,其实很年轻啊,不努力有可能要被应届生碾压啊,但也不能妄自菲薄,我有实际业务经验,这个可能比其比赛名字更为宝贵,取长补短,让自己的技术方方面面都无懈可击,看了下比赛还是挺有意思的,主要是可以积累很多人脉,认识很多技术同仁,所以关注一下这几个平台,下次有比赛一定要去参加试试

3、再回到招人的事上,所以我觉得这些比赛的经历还是很重要的,即便没取得好的成绩,也可以说明对方是一个对技术有热情的人,而且是一个很自觉的人

4、接近要下班的时候,我又把我写的大概的要求,具体化逐条写明,然后也和以前的同学交流了下,可是否有人可以给我推荐

5、吃晚饭看一些行业资讯,回到办公室继续搞,关于招人的要求还没写完,因为有些我要和公开的招聘要求比对修改一下措辞,上班时间这种东西不是很好做查询,免得别人误会

6、先把招人的要求放了一放,然后开始解决相关系数另外一个疑问,为什么相关系数表示的是线性相关性,这种线性相关体现在哪里?先在百度上查了查,没有找到比较好的解释,但是我自己有点感觉,感觉这个P和用y=ax+b去拟合产生的误差是相关,可以说是另一种表达,但是我写出来大体看了看,没看出来该如何推导,我尝试在google上寻求解决方法,我突然发现这个东西似乎是和最小二乘法,以及所谓的R2是相关的,但是当时10点过了,只有回家了,那篇内容还需要深入研读!

原创粉丝点击