数据挖掘总结之分类与聚类的区别
来源:互联网 发布:淘宝上的12号塑料弹壳 编辑:程序博客网 时间:2024/05/16 09:05
分类与聚类的区别
Classification (分类):
一个 classifier会从它得到的训练集中进行“学习”,从而具备对未知数据进行分类的能力,这种提供训练数据的过程通常叫做 supervised learning (监督学习)。所谓分类,简单来说,就是根据文本的特征或属性,划分到已有的类别中。
常用的分类算法包括:决策树分类法,朴素的贝叶斯分类算法(native Bayesian classifier)、基于支持向量机(SVM)的分类器,神经网络法,k-最近邻法(k-nearest neighbor,kNN),模糊分类法等。分类作为一种监督学习方法,要求必须事先明确知道各个类别的信息,并且断言所有待分类项都有一个类别与之对应。但是很多时候上述条件得不到满足,尤其是在处理海量数据的时候,如果通过预处理使得数据满足分类算法的要求,则代价非常大,这时候可以考虑使用聚类算法。
Clustering(聚类):
简单地说就是把相似的东西分到一组,聚类的时候,我们并不关心某一类是什么,我们需要实现的目标只是把相似的东西聚到一起,因此,一个聚类算法通常只需要知道如何计算相似度就可以开始工作了,因此 clustering 通常并不需要使用训练数据进行学习,这在Machine Learning中被称作unsupervised learning (无监督学习)。聚类分析目的在于将相似的事物归类,同一类中的个体有较大的相似性,不同类的个体差异性很大。
0 0
- 数据挖掘总结之分类与聚类的区别
- 数据挖掘中,分类与聚类的区别
- 数据挖掘总结之数据挖掘与机器学习的区别
- 数据挖掘中的分类和聚类的区别
- 【MachineLearning】数据挖掘中的分类和聚类的区别
- 数据挖掘中分类与预测的区别
- 数据挖掘导论总结之分类技术
- 数据挖掘算法-聚类的分类
- 数据挖掘分类算法的优缺点总结
- 数据挖掘总结之有监督学习与无监督学习的区别
- 数据挖掘之分类
- 数据挖掘之分类
- 数据挖掘之分类
- 数据挖掘之分类
- 数据挖掘之分类
- 数据挖掘——之分类和预测总结
- 数据分析与数据挖掘的区别
- 数据分析与数据挖掘的区别
- 2015放假前夕
- [Lintcode]用栈实现队列
- Out of memory (Needed 6707872 bytes)
- [WC2016]鏖战表达式
- JVM内存管理:深入垃圾收集器与内存分配策略(一)
- 数据挖掘总结之分类与聚类的区别
- oc 调用 swift Demo
- View 滑动冲突处理方法
- [破解实例][OllyDbg] CrackMe002-Afkayas.1
- AutoLayout的三种设置方式之——NSLayoutConstraint代码篇
- MAC地址格式小结
- Linux文件列表权限
- 微信回复汇总
- QGis二次开发基础 -- 属性识别工具的实现