程序博客网 > 农村淘宝和阿里巴巴

数据挖掘--Apriori

来源：互联网发布：农村淘宝和阿里巴巴编辑：程序博客网时间：2024/05/22 13:59

Apriori：关联规则

Apriori 核心算法过程如下：

过单趟扫描数据库D计算出各个1项集的支持度，得到频繁1项集的集合。
连接步：为了生成，预先生成,由2个只有一个项不同的属于的频集做一个（k-2）JOIN运算得到的。
剪枝步：由于是的超集，所以可能有些元素不是频繁的。在潜在k项集的某个子集不是中的成员是，则该潜在频繁项集不可能是频繁的可以从中移去。
通过单趟扫描数据库D，计算中各个项集的支持度，将中不满足支持度的项集去掉形成。

　　通过迭代循环，重复步骤2～4，直到有某个r值使得为空，这时算法停止。在剪枝步中的每个元素需在交易数据库中进行验证来决定其是否加入，这里的验证过程是算法性能的一个瓶颈。这个方法要求多次扫描可能很大的交易数据库。可能产生大量的候选集，以及可能需要重复扫描数据库，是Apriori算法的两大缺点。

　　目前，几乎所有高效的发现关联规则的并行数据挖掘算法都是基于Apriori算法的，Agrawal和Shafer 提出了三种并行算法：计数分发（Count Distribution）算法、数据分发（Data Distribution）算法和候选分发（Candidate Distribute）算法。

0 0

农村淘宝和阿里巴巴

农村淘宝和阿里巴巴

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子学习画画小画画关于画画我要画画画画的软件画画成人班画画学习班 ps画画教程教你画画简单的画画画画初学美术画画图涂涂画画大师画画画画步骤高中生画画儿童画画班画画自己教我们画画我们画画吧看画画教儿童画画画画画画画班图片照片画画画画画什么画画的人画画人画画资料学简单画画画画素描快速画画画画的步骤画画机构学美术画画画画画画画画画学习 5岁儿童画画素描画画怎么画画呢国庆节画画大全