关联规则挖掘

来源：互联网发布：公积金管理系统uc矩阵编辑：程序博客网时间：2024/05/16 07:30

1.Apriori关联规则挖掘

----->Apriori算法希望的是完全的标称型数据，如果有数值型属性，必须先进行离散化。接下来我们导入数据集，切换至Associate面板，启动Apriori运行

----->Apriori算法输出的10条规则，按照每一条规则后括号内的置信度量进行排序。规则按照"前件 num.1--->结论 num.2"的形式表示，前件后面的数字表示有多少个实例满足前件，结论后的数字表示有多少个实例满足整个规则，这即是规则的支持度.

------->现在研究Apriori参数的设置

------->设置outputItemSets为true，再次运行Apriori算法,会显示所有这些不同项集和支持的实例数

2.挖掘现实数据集

----->下面以美国国会议员投票信息的分析挖掘为例，我们的任务是基于投票模式预测其所属党派。

------>现在加载数据集，切换至Associate面板，选择Apriori算法。

------->首先，输出中列出的最小支持度为0.45（196个实例），最小置信度度量为0.9，执行的次数为11.具体的10条规则就不一一分析了

------->下面我们单击Visualize All按钮，弹出可视化窗口

------>图中蓝色代表民主党，红色代表共和党。在前四行的16项属性中，由多项属性蓝色占据绝对的统治地位，基本全是蓝色柱；而红色占据统治地位的只有很少的几个属性，又因为覆盖率低而不具备竞争优势，未能入选。在人数上民主党占优势（267：168），加上有明确的政治观点，因此前十条关联规则都打上民主党的印

3.市场购物篮分析

------->加载数据，单击预处理的“Edit”，打开数据集的Viewer窗口，查看数据文件，理解该数据结构

--------->切换至关联面板，启动Apriori算法

-------->分析十条关联规则，对于超市的经理来说，这些信息十分重要，可以根据挖掘到的知识重新安排货架，重新布局超市，提供快速付款通道以及安排送货的附加服务，以期提升市场竞争力。

0 0