聚类指标Rand Index

来源:互联网 发布:客户数据库系统excl 编辑:程序博客网 时间:2024/05/18 03:59

假设一个集合中有N篇文章

一个集合中有N(N-1)/2个集合对

TP:同一类的文章被分到同一个簇

TN:不同类的文章被分到不同簇

FP:不同类的文章被分到同一个簇

FN:同一类的文章被分到不同簇

Rand Index度量的正确的百分比

RI = (TP+TN)/(TP+FP+FN+TN)


因此,FP=40-20=20.

同理,



因此,TN=96-24=72.

 

Same cluster

Different clusters

Same class

TP=20

FN=24

Different classes

FP=20

TN=72

RI=(20+72)/(20+20+24+72)=0.68

 

Precision=TP/(TP+FP)

Recall=TP/(TP+FN)

F1=2×Recall×Precision/(Recall+Precision)

 

Precision=20/40=0.5

Recall=20/44=0.455

F1=(2*0.5*0.455)/(0.5+0.455)=0.48

0 0
原创粉丝点击