数据挖掘鄙视题-判断题

来源：互联网发布：vb replace函数用法编辑：程序博客网时间：2024/05/21 07:05

数据挖掘的主要任务是从数据中发现潜在的规则，从而能更好的完成描述数据、预测数据等任务。 (对)
数据挖掘的目标不在于数据采集策略，而在于对于已经存在的数据进行模式的发掘。（对）3. 图挖掘技术在社会网络分析中扮演了重要的角色。（对）
模式为对数据集的全局性总结，它对整个测量空间的每一点做出描述；模型则对变量变化空间的一个有限区域做出描述。（错）
寻找模式和规则主要是对数据进行干扰，使其符合某种规则以及模式。（错）
离群点可以是合法的数据对象或者值。　　　　（对）
离散属性总是具有有限个值。　　　　　　　　（错）
噪声和伪像是数据错误这一相同表述的两种叫法。　　　　　（错）
用于分类的离散化方法之间的根本区别在于是否使用类信息。　　　（对）
特征提取技术并不依赖于特定的领域。　　　　　　（错）
序列数据没有时间戳。　　　　　　（对）
定量属性可以是整数值或者是连续值。　　　　　（对）
可视化技术对于分析的数据类型通常不是专用性的。　　　　（错）
DSS主要是基于数据仓库.联机数据分析和数据挖掘技术的应用。（对）
OLAP技术侧重于把数据库中的数据进行分析、转换成辅助决策信息，是继数据库技术发展之后迅猛发展起来的一种新技术。（对）
商业智能系统与一般交易系统之间在系统设计上的主要区别在于：后者把结构强加于商务之上，一旦系统设计完毕，其程序和规则不会轻易改变；而前者则是一个学习型系统，能自动适应商务不断变化的要求。（对）
数据仓库中间层OLAP服务器只能采用关系型OLAP （错）
数据仓库系统的组成部分包括数据仓库，仓库管理，数据抽取，分析工具等四个部分. (错)
Web数据挖掘是通过数据库仲的一些属性来预测另一个属性,它在验证用户提出的假设过程中提取信息. （错）
关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则。（错）
利用先验原理可以帮助减少频繁项集产生时需要探查的候选项个数（对）。
先验原理可以表述为：如果一个项集是频繁的，那包含它的所有项集也是频繁的。（错）
如果规则不满足置信度阈值，则形如的规则一定也不满足置信度阈值，其中是X的子集。（对）
具有较高的支持度的项集具有较高的置信度。（错）
聚类（clustering）是这样的过程：它找出描述并区分数据类或概念的模型(或函数)，以便能够使用模型预测类标记未知的对象类。（错）
分类和回归都可用于预测，分类的输出是离散的类别值，而回归的输出是连续数值。(对)
对于SVM分类算法，待分样本集中的大部分样本不是支持向量，移去或者减少这些样本对分类结果没有影响。（对）
Bayes法是一种在已知后验概率与类条件概率的情况下的模式分类方法，待分样本的分类结果取决于各类域中样本的全体。 (错)
分类模型的误差大致分为两种：训练误差（training error）和泛化误差（generalization error）. (对)
在决策树中，随着树中结点数变得太大，即使模型的训练误差还在继续减低，但是检验误差开始增大，这是出现了模型拟合不足的问题。（错）
SVM是这样一个分类器，他寻找具有最小边缘的超平面，因此它也经常被称为最小边缘分类器（minimal margin classifier） (错)
在聚类分析当中，簇内的相似性越大，簇间的差别越大，聚类的效果就越差。（错）
聚类分析可以看作是一种非监督的分类。（对）
K均值是一种产生划分聚类的基于密度的聚类算法，簇的个数由算法自动地确定。（错）
给定由两次运行K均值产生的两个不同的簇集，误差的平方和最大的那个应该被视为较优。（错）
基于邻近度的离群点检测方法不能处理具有不同密度区域的数据集。（对）
如果一个对象不强属于任何簇，那么该对象是基于聚类的离群点。（对）
从点作为个体簇开始，每一步合并两个最接近的簇，这是一种分裂的层次聚类方法。（错）40. DBSCAN是相对抗噪声的，并且能够处理任意形状和大小的簇。（对）

0 0