机器学习实战学习笔记10——Apriori算法

来源:互联网 发布:plc编程学习视频 编辑:程序博客网 时间:2024/05/31 19:30

1.Apriori概述


1.1 Apriori介绍


Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。该算法已经被广泛的应用到消费市场价格分析,入侵检测、电商购物推荐等领域。

1.2 Apriori原理


关联分析是一种在大规模数据集中寻找频繁项集和关联规则的任务。该算法的基本思想是:
(1)首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。
(2)然后由频繁项集产生强关联规则,这些规则必须满足最小支持度和最小可信度。
(3)使用步骤(1)中找到的频繁项集产生期望的规则,产生只包含集合的项的所有规则。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。

1.3 Apriori优缺点


(1)优点:简单、易理解、数据要求低
(2)缺点:I/O负载较大、候选项集过多
(3)应用领域:消费市场价格分析,入侵检测、电商购物推荐

2.使用Apriori算法发现频繁项集


3.从频繁项集中挖掘关联规则


4.Apriori案例:发现国会投票中的模式


0 0