数据挖掘十大经典算法(4)Apriori
来源:互联网 发布:中文域名转码工具 编辑:程序博客网 时间:2024/05/18 06:58
Apriori算法是种最有影响的挖掘布尔关联规则频繁项集的算法。它的核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里,所有支持度大于最小支持度的项集称为频繁项集(简称频集),也常称为最大项目集。
在Apriori算法中,寻找最大项目集(频繁项集)的基本思想是:算法需要对数据集进行多步处理。第一步,简单统计所有含一个元素项目集出现的频数,并找出那些不小于最小支持度的项目集,即一维最大项目集。从第二步开始循环处理直到再没有最大项目集生成。循环过程是:第k步中,根据第k-1步生成的(k-1)维最大项目集产生k维侯选项目集,然后对数据库进行搜索,得到侯选项目集的项集支持度,与最小支持度进行比较,从而找到k维最大项目集。
从算法的运行过程,我们可以看出该Apriori算法的优点:简单、易理解、数据要求低,然而我们也可以看到Apriori算法的缺点:
(1)在每一步产生侯选项目集时循环产生的组合过多,没有排除不应该参与组合的元素;
(2)每次计算项集的支持度时,都对数据库D中的全部记录进行了一遍扫描比较,如果是一个大型的数据库的话,这种扫描比较会大大增加计算机系统的I/O开销。而这种代价是随着数据库的记录的增加呈现出几何级数的增加。因此人们开始寻求更好性能的算法,如F-P算法。
0 0
- 数据挖掘十大经典算法(4) The Apriori algorithm
- 数据挖掘十大经典算法(4) The Apriori algorithm
- 数据挖掘十大经典算法(4) The Apriori algorithm
- 数据挖掘十大经典算法(4) The Apriori algorithm .
- 数据挖掘十大经典算法(4) The Apriori algorithm
- 数据挖掘十大经典算法(4) The Apriori algorithm
- 数据挖掘十大经典算法(4) The Apriori algorithm
- 数据挖掘十大经典算法(4)Apriori
- 数据挖掘十大经典算法之apriori算法&源代码
- 数据挖掘十大经典算法之apriori算法&源代码
- 数据挖掘十大经典算法之Apriori算法
- 十大经典数据挖掘算法之Apriori算法
- 数据挖掘十大经典算法之一--APRIORI
- 数据挖掘十大算法--Apriori算法
- 数据挖掘十大算法--Apriori算法
- 转载 数据挖掘十大经典算法(4) The Apriori algorithm
- 数据挖掘十大经典算法之Apriori算法以及Java实现
- 数据挖掘十大经典算法(四) The Apriori algorithm
- springxml的注入方式
- 02-线性结构4 Pop Sequence (25分)
- 【索引】Codeforces
- 错误51error LNK1112: 模块计算机类型“X86”与目标计算机类型“x64”冲突 opencv_core248d.lib opencv_core248d.dll
- linux
- 数据挖掘十大经典算法(4)Apriori
- 去掉Myeclipse对JS等文件的验证(Cannot return from outside a function or method)
- YII2 安装
- 第九周项目4-广义表算法库及应用(2)
- synchronized 和 Lock
- 源码-Oracle数据库管理-第十一章-Oracle内置函数-Part 4(类型转换函数)
- 求出0~n内 数字9出现的个数
- MongoDB
- 2016年8月19日-第三章练习