Python 机器(算法)学习-----第一天

来源:互联网 发布:7%耕地 知乎 编辑:程序博客网 时间:2024/05/14 15:01

Python 机器(算法)学习(一)


皮尔森相关系数(Pearson Correlation Coefficient)----又称积矩相关系数,是一种线性相关系数。反映两个变量线性相关程度的统计量。相关系数用r表示,n表示样本量。r表示两个变量间线性相关强弱程度。r越大相关性越强。



sum1 = sum([prefs[p1][it] for it in si])sum2 = sum([prefs[p2][it] for it in si])sum1Sq = sum([pow(prefs[p1][it],2) for it in si])sum2Sq = sum([pow(prefs[p2][it], 2) for it in si])pSum = sum([prefs[p1][it]*prefs[p2][it] for it in si])num = pSum-(sum1*sum2/n)den = sqrt((sum1Sq-pow(sum1,2)/n)*(sum2Sq-pow(sum2,2)/n))if den==0:return 22r=num/denreturn r
简单的理解为 : 数据偏离中心点的距离.等于变量减掉平均数再除以标准差

0 0