【读书笔记-数据挖掘概念与技术】挖掘频繁模式、关联和相关性:基本概念和方法
来源:互联网 发布:js设置时间间隔 编辑:程序博客网 时间:2024/05/01 04:26
频繁模式:频繁出现的模式(可以是项集、子序列或子结构)
基本概念
- 支持度:support
- 置信度:confidence
- 关联规则:association
- 找出所有的频繁项集:出现次数≥最小支持计数
- 由频繁项集产生强关联的规则(定义最小支持度和最小置信度)
- 频度(支持度计数):出现的次数
- 频繁项集:项集I的相对支持度满足预定义的最小支持度阈值
- 闭频繁项集:不存在真超项集Y使得Y与X在D中具有相同的支持度计数
- X是D中的极大频繁项集:X是D中的极大频繁项集或极大项集,如果X是频繁的,并且不存在超项集Y使得X包含于Y,并且Y在D中是频繁的
频繁项集挖掘方法
priori(先验)算法
- 发现频繁项集
2.产生关联规则
提高Apriori算法的效率
- 基于散列的计数
- 事务压缩
- 划分
- 抽样
- 动态项集计数
挖掘频繁项集的模式增长方法——Frequent-Pattern Growth,FP-growth——频繁模式树(FP树)
使用垂直数据格式挖掘频繁项集
挖掘模式和极大模式
—————————————————————————————————————————————————————————————————————————————
模式评估方法
∵强规则不一定是有趣的
∴关联分析——>相关分析
几个度量:
- 提升度(与零事务有关)
- X²分析(与零事务有关)
- 全置信度(零不变度量)
- 最大置信度(零不变度量)
- Kulxynaki(零不变度量)
- 余弦(零不变度量)
0 0
- 【读书笔记-数据挖掘概念与技术】挖掘频繁模式、关联和相关性:基本概念和方法
- 【数据挖掘概念与技术】学习笔记6-挖掘频繁模式、关联和相关性:基本概念和方法(编缉中)
- 【数据挖掘笔记六】挖掘频繁模式、关联和相关性:基本概念和方法
- 挖掘频繁模式、关联和相关性:基本概念和方法
- 挖掘频繁模式、关联和相关性:基本概念和方法
- 6.数据挖掘概念笔记——挖掘频繁模式、关联和相关性术
- 第六章 挖掘频繁模式、关联和相关性:基本概念和方法
- 第六章 挖掘频繁模式、关联和相关性:基本概念和方法
- 数据挖掘--频繁模式、关联性和相关性
- 数据挖掘--挖掘频繁模式、关联和相关(1)
- 数据挖掘--挖掘频繁模式、关联和相关(2)
- 【读书笔记-数据挖掘概念与技术】高级模式挖掘
- 挖掘频繁模、关联和相关性(1)
- 挖掘频繁模、关联和相关性(2)
- 挖掘频繁模、关联和相关性(3)
- 数据挖掘概念和技术读书笔记
- 数据挖掘概念和技术读书笔记2
- 数据挖掘系列之三:频繁模式、关联和相关
- 侃侃Thinking In Java
- NYOJ 811 变态最大值
- RHEL7 USB installation problem and solving
- Discuz! System Error,您当前的访问请求当中含有非法字符
- 1.快恶心死了才把BBB(REVC)gpioLedExample弄出来,重点是裸机环境构建啦!!
- 【读书笔记-数据挖掘概念与技术】挖掘频繁模式、关联和相关性:基本概念和方法
- 黑马程序员_【总结】_ 高新_3_泛型和类型参数
- sift 不易理解的地方
- ubuntu中eclipse下安装pydev插件不成功及解决方法
- 最长单调递增子序列问题
- 静态网页制作(重构们的工作内容)
- 强连通tarjan模版
- android 桌面widget开发
- PowerManager之WakeLock