频繁模式挖掘的模式评估方法

来源:互联网 发布:路由器映射加端口号 编辑:程序博客网 时间:2024/05/17 07:42

频繁模式挖掘可以出很多模式,但是判断一个模式是否有趣,需要用到模式的评估方法。下面介绍常用的模式评估方法。(假设项集AB

1、支持度

  包含项集AB的项的元组数与所有元组数的比值,一般计为PAB)。

2、置信度

  模式A--> B的置信度为PB|A

3、提升度

       liftA, B= P(AB)/(P()*P(B)),提升度大于1为正相关,小于1为负相关,等于1为独立。

4、卡方度量

5、全置信度

       all_conf(A, B) = min{P(A|B), P(B|A)}

6、最大置信度

       max_conf(A, B) = max{P(A|B), P(B|A)}

7Kulczynski度量

Kulc(A, B) = 1/(2*(P(A|B) + P(B|A)

8、余弦度量

cosine = sqrt(P(A|B) * P(B|A))

这些度量中,只有提升度和卡方度量不是零不变度量,但是其他度量也会面临不平衡问题,为此,引入不平衡比:


   其中,sup表示置信度。