关联规则挖掘

来源:互联网 发布:公积金管理系统uc矩阵 编辑:程序博客网 时间:2024/05/16 07:30

 1.Apriori关联规则挖掘

  ----->Apriori算法希望的是完全的标称型数据,如果有数值型属性,必须先进行离散化。接下来我们导入数据集,切换至Associate面板,启动Apriori运行



----->Apriori算法输出的10条规则,按照每一条规则后括号内的置信度量进行排序。规则按照"前件 num.1--->结论 num.2"的形式表示,前件后面的数字表示有多少个实例满足前件,结论后的数字表示有多少个实例满足整个规则,这即是规则的支持度.


------->现在研究Apriori参数的设置



------->设置outputItemSets为true,再次运行Apriori算法,会显示所有这些不同项集和支持的实例数




 2.挖掘现实数据集

  ----->下面以美国国会议员投票信息的分析挖掘为例,我们的任务是基于投票模式预测其所属党派。


 ------>现在加载数据集,切换至Associate面板,选择Apriori算法。




------->首先,输出中列出的最小支持度为0.45(196个实例),最小置信度度量为0.9,执行的次数为11.具体的10条规则就不一一分析了


------->下面我们单击Visualize All按钮,弹出可视化窗口



------>图中蓝色代表民主党,红色代表共和党。在前四行的16项属性中,由多项属性蓝色占据绝对的统治地位,基本全是蓝色柱;而红色占据统治地位的只有很少的几个属性,又因为覆盖率低而不具备竞争优势,未能入选。在人数上民主党占优势(267:168),加上有明确的政治观点,因此前十条关联规则都打上民主党的印


 3.市场购物篮分析

  ------->加载数据,单击预处理的“Edit”,打开数据集的Viewer窗口,查看数据文件,理解该数据结构



--------->切换至关联面板,启动Apriori算法



-------->分析十条关联规则,对于超市的经理来说,这些信息十分重要,可以根据挖掘到的知识重新安排货架,重新布局超市,提供快速付款通道以及安排送货的附加服务,以期提升市场竞争力。



0 0
原创粉丝点击