皮尔逊相关度
来源:互联网 发布:网店的营销策略数据 编辑:程序博客网 时间:2024/05/22 08:02
在进行影片相似度计算的时候,有的人对于影片的评分习惯偏低,有的人习惯偏高,皮尔逊方法可以修正“夸大分值”的情况。
如果某人总是倾向于给出比另一个人更高的分值,而二者的分值又始终保持一致,则他们也会存在很高的相关性。
# recommendations.py# 返回p1和p2的相关系数def sim_pearson(prefs,p1,p2): # 得到双方都曾评价过的物品列表 si={} for item in prefs[p1]: if item in prefs[p2]: si[item]=1 # 列表元素的个数 n=len(si) # 如果两者没有共同之处,则返回1 if n==0:return 1 # 对所有的偏好求和 sum1=sum([prefs[p1][it]for it in si]) sum2=sum([prefs[p2][it]for it in si]) #求平方和 sum1sq=sum([pow(prefs[p1][it],2)for it in si]) sum2sq=sum([pow(prefs[p2][it],2)for it in si]) #求乘积之和 psum=sum([prefs[p1][it]*prefs[p2][it]for it in si]) # 计算皮尔逊评价值 num=psum-(sum1*sum2/n) den=sqrt((sum1sq-pow(sum1,2)/n)*(sum2sq-pow(sum2,2)/n)) if den==0:return 0 r=num/den return r 该函数将会返回一个介于-1和1之间的数值。
阅读全文
0 0
- 皮尔逊相关度
- 皮尔逊相关度评价
- 皮尔逊相关度评价函数
- 欧几里德距离&皮尔逊相关度系数
- 相关度度量之皮尔逊相关系数
- lucene相关度
- 相关度得分
- Lucene相关度排序
- 相关度算法BM25
- 11、相关度排序
- 相关度排序
- ElasticSearch相关度计算
- 计算数据的相似度:欧几里德、皮尔逊相关度
- 距离有多远?欧几里德距离&皮尔逊相关度系数
- 距离有多远?欧几里德距离&皮尔逊相关度系数
- 皮尔逊相关度系数原理,以及java实现
- 推荐物品算法:欧几里得距离评价&皮尔逊相关度评价
- 皮尔逊相关度系数原理,以及java实现
- 置换和轮换(新姿势,摘自黑书)
- 51nod 1686 第K大区间(二分 尺取)
- Java8 Stream 流中的匹配查找方法
- std::ios::sync_with_stdio(false); cin.tie(0);
- 95
- 皮尔逊相关度
- 小程序相对于传统推广的优势所在
- LinkedList、ArrayList、 Vector的区别和详解
- LeetCode70.Climbing Stairs
- Redis 探究底层存储结构
- ubuntu 14.04 安装cuda
- OpenCV-将图像缩放并显示
- CircleImageView 圆形imageView(转载)
- 第四周项目5(2)--- 循环双链表应用