数据挖掘与知识发现课后习题答案
来源:互联网 发布:淘宝361官方旗舰店 编辑:程序博客网 时间:2024/05/21 09:43
2、给出一个将关联规则应用于互联网上的例子。
购物分析,通过关联规则推荐与购买物品置信度较高的物品。
3、指出Apriori算法的性能瓶颈。
一是由于对海量数据库的多趟扫描,另一个是用JOIN运算产生潜在频繁项集。
4、指出采用FP_tree结构的优缺点。
优点:在完备性方面,它不会打破交易中的任何模式,而且包含了挖掘序列模式所需的全部信息;在紧密性方面,它剔除不想关信息,不包含非频繁项,按支持度降序排列,支持度高的项在FP_tree中共享的机会也高。性能研究表明FPtree中共享的机会也高。性能研究表明FP_growth比Apriori快一个数量级,这是由于FP_growth不生成候选集,不用候选测试,而且使用紧缩的数据结构,避免重复扫描数据库。FP_growth的基本操作是计数和建立FP_tree。
缺点:当数据库规模非常大时,在内存中构建FP_tree是不切合实际的。
5,数据库有4个事务,设最小支持度为60%,最小信任度为80%
TidDATAITEMS_BOUGHTT1003/5/2003{A,C,S,L}T2003/5/2003{D,A,C,E,B}T3004/5/2003{A,B,C}T4004/5/2003{C,A,B,E}要求好到频繁项集,列出强关联规则。
题目可以列出频繁项集,但没有强关联规则,置信度都小于80%。FP树看书上28页的例题,一看就懂。
反正我算不出来。算出来的留言。
阅读全文
0 0
- 数据挖掘与知识发现课后习题答案
- 数据挖掘概念与技术(原书第三版)范明 孟小峰译-----第一章课后习题答案
- 数据挖掘概念与技术(原书第三版)范明 孟小峰译-----第二章课后习题答案
- 数据挖掘概念与技术(原书第三版)范明 孟小峰译-----第三章课后习题答案
- 数据挖掘概念与技术(原书第三版)范明 孟小峰译-----第六章课后习题答案
- SDH原理与运用 课后习题答案
- 数据挖掘与知识发现领域研修建议
- 数据挖掘与知识发现领域研修建议
- 【摘录】大数据挖掘与知识发现的应用领域
- 课后习题答案
- 《数据挖掘概念与技术》(第二版) 习题5.1(d)答案
- 数据挖掘概念与技术第三版 范明、孟晓峰译 第三章习题答案
- 数据挖掘概念与技术第三版 范明 孟晓峰译 第四章习题答案
- 3000份大学课后习题答案与大家分享啦~~
- 3500份课程课后习题答案与大家分享~~
- 3500份课程课后习题答案与大家分享~~
- 3500份课程课后习题答案与大家分享~~
- 3500份课程课后习题答案与大家分享~~
- Java基础知识02-流程控制-swith
- GDB调试命令~
- hadoop之hdfs基本原理(二)
- Web应用中实现页面加载提示
- [后缀自动机][单调队列优化DP] BZOJ 2806: [Ctsc2012]Cheat
- 数据挖掘与知识发现课后习题答案
- Verilog入门笔记
- mysql开启远程后还无法连接
- 【CodeForces-617E】XOR and Favorite Number 莫队(好玩题)
- 2017年浙江工业大学大学生程序设计迎新赛决赛—网络同步赛 E 栗酱的数列【差分+KMP】
- 【HTML5 canvas】关于canvas标签的理解和简单应用
- Exception: java.io.IOException: Keystore was tampered with, or password was incorrect
- 2017年浙江工业大学大学生程序设计迎新赛决赛—网络同步赛 F 栗酱的不等式【二分】
- 纯干货18