人工智能算法---关联法则的故事

来源:互联网 发布:java 字符串数组拼接 编辑:程序博客网 时间:2024/05/17 04:43

<!-- /* Font Definitions */ @font-face{font-family:宋体;panose-1:2 1 6 0 3 1 1 1 1 1;mso-font-alt:SimSun;mso-font-charset:134;mso-generic-font-family:auto;mso-font-pitch:variable;mso-font-signature:3 135135232 16 0 262145 0;}@font-face{font-family:"/@宋体";panose-1:2 1 6 0 3 1 1 1 1 1;mso-font-charset:134;mso-generic-font-family:auto;mso-font-pitch:variable;mso-font-signature:3 135135232 16 0 262145 0;} /* Style Definitions */ p.MsoNormal, li.MsoNormal, div.MsoNormal{mso-style-parent:"";margin:0cm;margin-bottom:.0001pt;text-align:justify;text-justify:inter-ideograph;mso-pagination:none;font-size:10.5pt;mso-bidi-font-size:12.0pt;font-family:"Times New Roman";mso-fareast-font-family:宋体;mso-font-kerning:1.0pt;} /* Page Definitions */ @page{mso-page-border-surround-header:no;mso-page-border-surround-footer:no;}@page Section1{size:595.3pt 841.9pt;margin:72.0pt 90.0pt 72.0pt 90.0pt;mso-header-margin:42.55pt;mso-footer-margin:49.6pt;mso-paper-source:0;layout-grid:15.6pt;}div.Section1{page:Section1;} /* List Definitions */ @list l0{mso-list-id:1496728350;mso-list-type:hybrid;mso-list-template-ids:223803554 -1077112638 67698713 67698715 67698703 67698713 67698715 67698703 67698713 67698715;}@list l0:level1{mso-level-tab-stop:18.0pt;mso-level-number-position:left;margin-left:18.0pt;text-indent:-18.0pt;}ol{margin-bottom:0cm;}ul{margin-bottom:0cm;}-->

Bayes公式与lift

问题:

       本文主要讨论,lift值的由来及其具体含义

 

前提:

考虑两种商品(A,B)的情况,设总交易量为SA商品出现在所有交易中的次数为AnB商品为Bn;同时出现次数为Tn。不失一般性,我们考虑B-->A的情况,即:考虑购买B的条件下购买A的可能性,显然,这等价于考虑P(A|B)

 

开始:

1.support值:

support=Tn/S=P(AB)support值没有反应BA的作用,即P(AB)值的大小,并不能反映A,B商品之间的关系。

 

2.confidence值:

由贝叶斯定理可知:P(A|B)=P(B|A)P(A)/P(B)=P(AB)/P(B)

P(AB)/P(B)=(Tn/S)/(Bn/S)=Tn/Bn=confidence值。到这里P(A|B)已求得,似乎一切都该应该结束了,但是P(A|B)的值就算再大,再接近1,如果不考察它与P(A)的关系,我们就不知道B商品对A商品的促进作用相对于A商品自身来说到底有多大,相关分析就失去了意义。

 

3.lift

由以上分析,为了考察P(A|B)P(A)之间的关系,于是定义lift=P(A|B)/P(A)=P(AB)/P(A)P(B)

再进一步考察lift值,lift=P(A|B)/P(A)=(Tn/Bn)/(An/S)=(S*Tn)/(Bn*An)=P(B|A)/P(B),

这表明对于lift值来说,它只表明了AB之间的相互影响,并不能说明是A促进B还是B促进A。如何解决这一问题呢?当然是考察P(A|B)P(B|A):如果两者相等,则表明这种促进作用对两者来说都是等可能的;如果P(A|B)大于P(B|A),这表明B促进A的可能性更大;反之亦然。这里不失一般性,假设P(A|B)的概率更大,由此可以解释lift取各种值的含义:

lift=1时,有P(A|B)=P(A)P(AB)=P(A)P(B),这表明AB独立不存在谁引起谁的问题,此时,如果卖场将A,B商品放在一起,其效果等于分别摆放A,B商品。

lift<1时,有P(A|B)<P(A),这表明由B引起买A的概率小于单独买A的概率,此时,如果卖场将A,B商品放在一起,其效果不会好于分别摆放A,B商品。

lift>1时,有P(A|B)>P(A),这表明由B引起买A的概率大于单独买A的概率,此时,如果卖场将A,B商品放在一起,其效果不会差于分别摆放A,B商品。