关联规则挖掘算法-CATS Tree(Compressed and Arranged Transaction Sequences Tree)
来源:互联网 发布:磨刀器哪个牌子好 知乎 编辑:程序博客网 时间:2024/06/15 09:24
CATS Tree
压缩排序事务树
FPTree的一个扩展
允许单路径频繁模式挖掘
适用于多种支持度、流数据、增量数据的情况
算法基本过程
数据集
新建root节点
扫描TID1,构建CATS Tree 每个节点计数为1
扫描TID2,可以看出两条数据的共同路径是f-a-c-m,而已构建额树结构中不包含item:d
则从d的父节点M建立分支,将之后的节点顺序加入facm节点数加1,其余新增节点计数为1,,如图figure1所示
扫描TID3,B,F,H,J,O 共同路径为f,则f节点计数加1,同时在f顺序增加子节点bhjo,计数为1
扫描TID4,这里没有共同的项,则直接在root节点下新增子节点,顺序添加,计数为1,如图figure2
扫描TID5,这里与原树相比较,有共同项f-a-c-m-p,则触发了p节点与前置节点d的交换
当p节点交换结束,没有共同项,TID5中剩余的项在路径f-a-c-m下新建分支,顺序加入,计数增1
CATS Tree 与 FP-Tree的比较
CATS Tree:
包含事务中所有的项
子树被局部优化以改善压缩
从root到叶子节点的路径中项的排序是根据局部支持度计数
同一个父节点的CATS节点根据局部支持度计数按降序排列
FP-Tree:
只包含频繁项
子树不是局部优化的
从root到叶子节点的路径中项的排序是不是根据局部支持度计数
一个节点的所有子节点不是有序的
性质
1)所有子节点的频繁度计数之和小于等于父节点
2)一个节点的所有子节点是有序的
伪代码
Algorithm: CATS Tree BuilderInput: set of transactionsOutput: CATS Tree1. PROCEDURE CATSTreeBuilder(input_set S)2. for all transactions t Î S3. for all i Î t4. i.(frequency in header)++;5. root.add(t);6. PROCEDURE add(transaction t)7. if (this.children Ç t ¹ Æ)8. child node.merge(t);9. else if (this.descendant Ç t ¹ Æ))10. swap descendant node and split childnode if necessary;11. descendant.merge(t);12. else13. this.children ¬ t;14. Reposition the merged node if necessary;15. PROCEDURE merge(transaction t)16. this.frequency++;17. remove this.item from t;18. node.add(t);
参考文献
【1】Cheung W, Zaane O R. Incremental Mining of Frequent Patterns without Candidate Generation or Support Constraint[C]// Database Engineering and Applications Symposium, 2003. Proceedings. Seventh International. IEEE, 2007:111-116.
- 关联规则挖掘算法-CATS Tree(Compressed and Arranged Transaction Sequences Tree)
- 【数据挖掘算法】关联规则——Fp-tree算法
- 数据挖掘——关联规则之FP-Tree算法
- 增量关联规则挖掘算法:canonical-order tree
- 关联挖掘算法FP-Tree
- 基于FP-tree的关联规则挖掘FP-growth算法基本思想
- 不产生候选集的关联规则挖掘算法FP-Tree
- 不产生候选集的关联规则挖掘算法FP-Tree
- 关联规则——FP-Tree算法
- 关联规则-FP Tree
- 关联规则 Apriori算法 和FP-tree算法
- 关联挖掘算法Apriori和FP-Tree学习
- 关联挖掘算法Apriori和FP-Tree学习
- 关联挖掘算法Apriori和FP-Tree学习
- 关联挖掘算法Apriori和FP-Tree学习
- 关联挖掘算法Apriori和FP-Tree学习
- 关联挖掘算法Apriori和FP-Tree学习
- 关联挖掘算法Apriori和FP-Tree学习
- 厉害到颤抖!这几个网站你到现在都没用过?陛下请收好我的膝盖
- ETL安装前的准备
- nginx初学指南
- 购物车的简单使用
- IDEA 字体 编码设置
- 关联规则挖掘算法-CATS Tree(Compressed and Arranged Transaction Sequences Tree)
- NestedScrollView中嵌套ViewPager导致不能左右切换的解决方法
- 玩转APK:实现Android APK瘦身99.99%
- 动画杂谈
- ES6学习笔记-Udacity
- 深入理解Spring MVC 思想
- 设计动物声音模拟器
- 利用JDBC连接mysql
- 【JZOJ 5419】【NOIP2017提高A组集训10.24】筹备计划