2017.05.08回顾 协方差 相关系数

来源:互联网 发布:系统策划 知乎 编辑:程序博客网 时间:2024/06/11 19:25

1、上午来到公司精神非常不好,也不知道为什么,有时候睡了有这么多个小时,就像中奖一样,还是会精神不好,只有去搜索一些资料来看,去逛了下kaggle,看了下知乎上人们对kaggle的评价,逛了下自己的投资收益,搜了下woe IV这一套评分卡建模方案有没有python实现,发现还是以前那个,到时候看可不可以直接站在巨人的肩膀上,上午顶着睡意开发合作方的模型

2、下午睡觉起来,精神恢复,开始飙车了,主要就是两个工程项目,一个就是继续改合作方的模型,第二个就是突然告诉我两步的接口要上线,这个两步接口本来之前就做好了,但是线上的单接口版本已经迭代了好几轮,所以我的解决方法是,直接用线上的单接口版本改成两接口版本,改的方法大致同以前,同时还修复了新用户6C的一个bug,最后数据表添加字段,上线正式环境,然后另外一边,partnership_v2的模型本地测试了一下也是没问题的,我然后把这个接口上传到线上,测试了下问题不大,相当于说一天之内完成了二个项目,但是我想效率应该还可以更快

3、昨天还有个插曲,证明我自己是个菜鸡,昨天上午去面试了一个人,他其中提到了相关性的计算,我就问他两个连续变量的相关性的是如何计算的?他想了下,写了个协方差的公式出来 ,COV(x,y) = E(xy) - E(x)E(y),其实我基础不好,不知道这是协方差(虽然曾经见过),晚上砖搬完,我就开始想他写的公式,一查,果不其然就是协方差的公式,再一查pearson相关系数就是标准化后的协方差,ρ = COV(x,y)/σxσy,黄司机差点翻车,然后查了一些资料,去更好地理解协方差和相关系数 ,协方差表征了两个变量的变化一致性,同增同减,大于0正相关,等于0不相关,小于0负相关,但是有一点如果协方差数值越大,是不是比数值小的相关程度更大,我觉得不一定,要看变量的取值范围,所以才有了pearson相关系数,无量纲化,消除了这种变化幅度的影响,但是我昨天的思考就卡在这里了,是怎么消除的?我还需要进一步思考一下,一种感性的想法就是,标准差是表征了随机变量偏离期望的平均程度,而协方差是乘积里面也含有一个偏离,两个偏离抵消,为什么取值在-1到1之间,如何理解?为什么是考察的两个变量间的线性相关性?先把问题留在这里,有时候思考这些东西也要认真不然很难领悟,一边聊天一边思考,效率太低了

昨天回到家,我记得已经是11点20了,但是还是上线玩了一下,真的没必要,本来就只想在手机上指派任务出去,但是不支持老的IOS,新的IOS容量又不够,这就麻烦了,怎么说?首先第一点,12点之前必须睡觉,不要跟着身体的感觉走,就是睡!第二点现在弄不好就不要上了,少几个任务有多大影响呢?不要强求,下一步把系统清理了,看是否可行。今天晚上回去可能需要上去领一下低保。周一周二周三还是不上线,浪费一个任务就浪费,多大回事呢?本来就没什么收益!那低保哪天领呢?那周三或周二只领低保,其他什么事都不要做!


0 0
原创粉丝点击