一些关于数据聚类,机器学习的一些理解

来源:互联网 发布:linux删除用户 编辑:程序博客网 时间:2024/05/06 08:00

数据聚类属于非监督式学习,非监督式学习是一种机器学习的方式,其并不需要人力来输入标签,它是监督式学习和强化学习等策略之外的一种选择。在监督式学习中,典型的任务是分类和回归分析,且需要使用到人工预先准备好的范例。其中数据的预测回归可以看成是单方向上的分类,文本分类同时可以看成是有目的的聚类,文本内容、URL排重也是聚类的一个过程,似乎数据分析中的一切方式都可以转换为聚类问题。

 

聚类一般的方法是将特征变换到其他维数空间,例如通过高斯函数将其特征映射到其他空间里的划分,也如向量空间模型中的高维空间夹角划分等。