【聚类】性能度量
来源:互联网 发布:mac 安装oracle 编辑:程序博客网 时间:2024/06/16 19:19
聚类的性能是很难度量,因为它是从数据中学习,并归类。数据的特性的多方面的,那么归类的结果也会是多种。比如苹果,可以从颜色(红、绿)也可以从形状(圆的、椭圆的)归类,没有一定的形式。
但是我们还是试图找到一些方法来评价聚类算法的性能。主要分为外部指标和内部指标两大类。外部指标是指,将结果与“参考的模型”(分好类)进行对比;内部指标是指,直接利用自身的聚类结果进行评价。
1 常用的外部指标
(1)Jaccard系数
主要判断隶属于相同类的个数。该个数越多,说明聚类效果越好。
2 常用的内部聚类
(1)perplexity值
perplexity值(困惑度)通常用于LDA, HDP等模型上,主要计算特征的概率。值越小越好。
(2)距离计算
类内的样本距离越小越好,类间的距离越大越好。
0 0
- 【聚类】性能度量
- 性能度量
- 性能度量
- python -- 性能度量 timeit
- Test #3:性能度量
- 指令流水线性能度量
- 机器学习: 性能度量
- 机器模型性能度量
- 机器学习笔记 - 性能度量
- 分类器的性能度量
- 算法的性能度量基础理论
- 机器学习之性能度量
- 机器学习模型性能度量
- 机器学习模型性能度量
- 【机器学习-西瓜书】九、聚类:性能度量;距离计算
- 机器学习算法-聚类(一、性能度量和距离计算)
- 度量Web性能的关键指标
- 度量Web性能的关键指标
- algorithm 题集六 (16.11.12)
- UGUI 打字机效果
- [网络安全]dSploit-Android系统下的网络分析和渗透套件的使用
- poj 2251 Dungeon Master (BFS)
- linux内核sysfs详解-1
- 【聚类】性能度量
- 【NOIP模拟题】【DFS】【位运算】【舞蹈链】2016.11.12第三题题解
- Spring 全注解配置 bean 和 调用 (7) properties文件注入
- leetcode-226 Invert Binary Tree
- N的阶乘有几个零经典问题
- python-安装easygui的方法
- linux之grep命令
- HDU.2095(异或运算)
- Waiting For Debugger 一定可以解决的方法