数据挖掘十大算法之Appriori算法
来源:互联网 发布:工业实时数据库公司 编辑:程序博客网 时间:2024/05/18 06:38
http://blog.csdn.net/qingdujun/article/details/46586721
1、引言
Appriori算法是用来干什么的?主要是用来解决类似于这样的问题:如果客户买了啤酒,他还会去买尿布吗?
理论的核心:
频繁项目集的子集仍是频繁项目集;非频繁项目集的超集是非频繁项目集。这个理论一直作为经典的数据挖掘理论被应用。
定理(Appriori 属性1).
如果项目集X是频繁项目集,那么它的所有非空子集都是频繁项目集。
定理(Appriori 属性2).
如果项目集X是非频繁项目集,那么它的所有超集都是非频繁项目集。
2、以一个实例来说明Appriori算法
题目:数据库有5个事务。设min_sup=60%,min_conf=80%。
(1)使用Apriori算法找出所有频繁项集。
(2)列举两条强关联规则。
解:(1)确定最小事物支持度计数为5*60%=3。
(2)确定最小可信度为80%。
a.频繁项目集L1={E,K,O},L1的非空子集S1有{E,K},{E,O},{K,O},{E},{K},{O},可得到关联规则如下:
E∧K->O cf=3/4=75%
E∧O->K cf=3/3=100%
K∧O->E cf=3/3=100%
E->K∧O cf=3/4=75%
K->E∧O cf=3/5=60%
O->E∧K cf=3/3=100%
最终输出的关联规则为:
E∧O->K cf=3/3=100%
K∧O->E cf=3/3=100%
O->E∧K cf=3/3=100%
b.对于频繁项目集{E,M,O}同理。
3、Word文档下载
(1)
原文作者:Joe Chael
原文地址:http://blog.csdn.net/qingdujun/article/details/46586721
- 数据挖掘十大算法之Appriori算法(3)
- 数据挖掘十大算法之Appriori算法
- 十大数据挖掘算法
- 十大数据挖掘算法
- 数据挖掘十大算法
- 数据挖掘十大算法
- 数据挖掘十大算法
- 数据挖掘十大算法
- 数据挖掘十大算法
- 数据挖掘十大算法
- 数据挖掘十大算法
- 十大数据挖掘算法
- 数据挖掘十大算法
- 数据挖掘十大算法
- 数据挖掘十大算法
- 十大数据挖掘算法
- 数据挖掘十大经典算法之apriori算法&源代码
- 数据挖掘十大经典算法之apriori算法&源代码
- Linux常用命令英文全称与中文解释Linux系统
- ionic angularjs 实现Enter键的提交
- java操作mysql数据库
- javascript中对象的深度克隆
- [WPF - 之一问一答系列] 如何从WPF的WebBrowser控件中获得WebResponse内容?为何WebBrowser控件的Navigated事件参数NavigationEventArgs的
- 数据挖掘十大算法之Appriori算法
- ANALYZE 和 DBMS_STATS 的异同
- 二叉搜索树的第k个结点
- MSDTC(分布式交易协调器)
- java 面试 奇葩点
- Effective C++条款7
- 数据挖据十大算法之ID3算法
- 不可思议的递归神经网络
- WPF WebBrowser中的Document 使用方法