Python实现KMeans聚类

来源:互联网 发布:吉首大学网络自助中心 编辑:程序博客网 时间:2024/06/06 02:54
from sklearn import datasets  #加载数据包from sklearn.cluster import KMeans  #加载KMeansfrom sklearn import cross_validation #加载交叉检验,然后处理数据data=datasets.load_iris()x=data.datay=data.targetx_train,x_test,y_train,y_test=cross_validation.train_test_split(x,y,test_size=0.25,                                            random_state=0,stratify=y)clu=KMeans(n_clusters=3)  #建立模型,选择分成三类clu.fit(x_train)        #训练模型y_=clu.predict(x_test[:10]) #测试y_test[:10]   #真实结果'''y_Out[23]: array([0, 0, 0, 0, 2, 2, 2, 0, 2, 1])y_test[:10]Out[24]: array([0, 0, 0, 0, 1, 1, 1, 0, 1, 2])从输出结果中可以看出,KMeans效果还是不错的,都聚成了一类'''