《机器学习实战》第十章 :K-均值聚类算法
来源:互联网 发布:淘宝店哪家衣服质量好 编辑:程序博客网 时间:2024/05/20 07:15
《机器学习实战》系列博客主要是实现并理解书中的代码,相当于读书笔记了。毕竟实战不能光看书。动手就能遇到许多奇奇怪怪的问题。博文比较粗糙,需结合书本。博主边查边学,水平有限,有问题的地方评论区请多指教。书中的代码和数据,网上有很多请自行下载。
10.1 K- 均值聚类算法
K- 均值聚类支持函数
数据的导入 ,向量距离的计算 , 随机质心计算
#coding: utf-8from numpy import *def loadDataSet(fileName): dataMat = [] fr = open(fileName) for line in fr.readlines(): curLine = line.strip().split('\t') #tab及换行符处理 fltLine = map(float,curLine) dataMat.append(fltLine) return dataMat def distEclud(vecA, vecB): return sqrt(sum(power(vecA - vecB, 2))) #计算两个向量的距离def randCent(dataSet, k): n = shape(dataSet)[1] centroids = mat(zeros((k,n)))# 随机生成k个簇中心 k行n列 for j in range(n): minJ = min(dataSet[:,j]) rangeJ = float(max(dataSet[:,j]) - minJ) centroids[:,j] = mat(minJ + rangeJ * random.rand(k,1)) return centroids
>>> import kMeans>>> from numpy import *>>> datMat = mat(kMeans.loadDataSet('testSet.txt'))>>> min(datMat[:,0])matrix([[-5.379713]])>>> max(datMat[:,0])matrix([[ 4.838138]])>>> kMeans.randCent(datMat,2)matrix([[ 0.8442008 , 4.54209089], [-2.47119846, -0.26540836]])
0 0
- 《机器学习实战》第十章 :K-均值聚类算法
- 机器学习实战 第十章 利用K-均值聚类算法对未标注数据分组
- 【机器学习实战04】k-均值聚类算法
- 【机器学习实战-python3】K-均值聚类算法
- 机器学习实战:K-均值及二分K-均值聚类算法
- 机器学习实战之 第10章 K-Means(K-均值)聚类算法
- 【机器学习实战】第10章 K-Means(K-均值)聚类算法
- 【机器学习实战】第10章 K-Means(均值)聚类算法
- 【机器学习实战之三】:C++实现K-均值(K-Means)聚类算法
- 《机器学习实战》kMeans算法(K均值聚类算法)
- 机器学习算法 - k-means Clustering K均值聚类
- 机器学习--k均值聚类(k-means)算法
- 《机器学习实战》之K-均值聚类算法的python实现
- 《机器学习实战》之二分K-均值聚类算法的python实现
- 《机器学习实战》二分-kMeans算法(二分K均值聚类)
- 机器学习实战-利用K-均值聚类算法对未标注数据分组
- 机器学习实战——k—均值聚类算法
- 机器学习实战笔记-利用K均值聚类算法对未标注数据分组
- JAVA面向对象 Part02 String常用Api , this static关键字
- 机器学习-什么是机器学习
- 同时执行两个线程
- Ubuntu出现包依赖错误的解决方法
- <操作系统>1. 概述
- 《机器学习实战》第十章 :K-均值聚类算法
- 数据结构课程设计报告 二叉树的应用
- 网络编程socket基本API详解(转)
- 理解MP算法
- 北京传智播客最后一期Net就业
- PAT-A1090
- another app is currently holding the yum lock;waiting for it to exit
- 313. Super Ugly Number
- 【Codeforces Round #403】Codeforces 781D Axel and Marston in Bitland