白话机器学习算法(十二)聚类,分类的一些总结

来源:互联网 发布:网络公开课观后感 编辑:程序博客网 时间:2024/05/21 14:53

http://blog.csdn.net/wangxin110000/article/details/22529629


所有的聚类问题,都可以简化成

1:找聚类中心的问题;

2:距离表示的问题,不同的聚类要求需要有不一样的距离定义;

3:数据表示的问题,比如数据降维,特征选择等等。

而所有的分类问题

1:寻找最优判断准则的问题;

2:数据最优表示的问题,比如低维没法分,可以放到高维度上去考虑,比如核方法,又或者像LDA那样,找个新空间,让数据的类内距离变小,类间距变大。这样的方法还有很多,比如流型学习那样,都是换个表示方法,或者换个距离测度让数据达到更容易分开的目的。


0 0
原创粉丝点击