天池冠军比赛心得体会

来源:互联网 发布:linux下启动matlab 编辑:程序博客网 时间:2024/04/29 02:53

1)首先一定要独立思考。以赛题为例,总会在论坛里看得到一些前人的思路或攻略,在独自对问题完成自己的思考之前,不要轻易地去使用别人的方法。因为这不是自己的思考成果,很难得到突破,同时也容易陷入到他人的思维框架里。这和实际中的工作是一致的,尽量自己思考解决问题,这对理解数据背后的业务本质会有很大帮助。


2)独立思考也有可能陷入自己思维框架的坑,难以突破。这时,他人的思想或方法对自己就可能很有用了,因为此时再去看别人的方法,已经是带着很深的理解去吸收他人的成果。当然这并不是必胜的方法论,当确实是难以突破的时候不妨将其放下,读读所使用方法的基础理论或处理下其他无相关的事项甚或让头脑轻松几天,再次把精力集中在问题上的时候,也许会得到新的灵感。


3)多从不同维度思考数据并动手验证,这会对数据产生足够的理解。举个简例,我以为路线上的常客会在该路线不同时段出现人数中占有很大的比例,但分析结果却让我大感意外。


4)尝试解决问题的不同方法。如以回归或以时序去看待问题,思考的方向会不同,每个方向的深挖,会对问题产生更深度的理解。


5)要深入运用历史数据。很多选手都注意到赛题的难点——元旦问题并没有相应的历史数据作为参考,那么有没有仔细考虑赛题提供的历史数据所蕴藏的信息呢?


6)平时做好积累。赛事总是很紧张的,投入赛事后会发现时间、精力和方法都不够用了。如果平时做好练习打好基本功,那么在比赛里会得心应手很多。Data Lab里的资源建议大家好好运用起来。


7)从一个有着实际工作经验的分析师的角度来看,比赛和实际工作会有所不同。比赛有明确的指标去突破,需要参赛者深入挖掘数据并深透理解算法的效用;而工作中更强调的是不同指标的平衡,以达到预期的目标,因此说基础一定要在学习阶段打好,在将来的工作中主要是应用,基础打好才会得心应手。


0 0