k-Means算法Matlab实现

来源:互联网 发布:小米如何禁止软件更新 编辑:程序博客网 时间:2024/05/02 00:51
clc;
clear;
%读取数据文件,生成点矩阵
fileID = fopen('D:\matlabFile\data.txt');
 C=textscan(fileID,'%f %f');
 fclose(fileID);
 %显示数组结果
%celldisp(C);
 %将cell类型转换为矩阵类型,这里只假设原数据为二维属性,且是二维的坐标点
 CC_init=cat(2,C{1},C{2});%用来保存初始加载的值
 CC=CC_init;
 %获得对象的数量
 num=length(C{1});
 %显示初始分布图
 %scatter(C{1},C{2},'filled');
 %%设置任意k个簇
k=3;
%临时存放k个中心点的数组
C_temp=zeros(k,2);
%判断所设置的k值是否小于对象的数量
if k<num
    %产生随机的k个整数
   randC=randperm(num);
   randC=randC(1:k);
   %从原数组中提出这三个点   
   for i=1:k
       C_temp(i,:)=CC(randC(1,i),:);
   end
   %将原数组中的这三个点清空
    for j=1:k
       CC(randC(1,j),:)=zeros(1,2);
    end  
    idZero=find(CC(:,1)==0);
    %删除为零的行
    [i1,j1]=find(CC==0);
    row=unique(i1);
    CC(row,:)=[];
   %分配k个二维数组,用来存放聚类点
   %分配行为k的存储单元
   cluster=cell(k,1,1); 
   %将剔除的三个点加入到对应的三个存储单元,每个单元的第一行置为0,为了存储相对应的簇中心
   for m=1:k
       cluster{m}=cat(1,zeros(1,2),C_temp(m,:));
   end
   %计算其他点到这k个点的距离,然后分配这些点,第一次遍历
   for ii=1:num-k
       %分别计算到三个点的距离       
       minValue=1000000;%最小值,要根据实际情况设定该值
       minNum=-1;%最小值序号
       for jj=1:k
           if minValue>sqrt((CC(ii,1)-C_temp(jj,1))*(CC(ii,1)-C_temp(jj,1))+(CC(ii,2)-C_temp(jj,2))*(CC(ii,2)-C_temp(jj,2)))
               minValue=sqrt((CC(ii,1)-C_temp(jj,1))*(CC(ii,1)-C_temp(jj,1))+(CC(ii,2)-C_temp(jj,2))*(CC(ii,2)-C_temp(jj,2)));
               minNum=jj;
           end
       end
       cluster{minNum}=cat(1,cluster{minNum},CC(ii,:));       
   end
   %初次计算簇中心
   for n=1:k
       c=cluster{n};
       c(1,:)=[];
       cluster{n}(1,:)=mean(c,1);       
   end   
   %下面重复计算簇中心,直到没有变化为止
   flag=1;
   count=0;
   while flag==1
       %将cluster除第一行之外的数据全部清空
       for i=1:k
           c=cluster{i}(1,:);
           cluster{i}=[];
           cluster{i}=c;
       end
       %把所有点重新分簇
       for j=1:num
           minValue=1000000;%最小值,要根据实际情况设定该值
           minNum=-1;%最小值序号
           for i=1:k
               if minValue>sqrt((CC_init(j,1)-cluster{i}(1,1))*(CC_init(j,1)-cluster{i}(1,1))+(CC_init(j,2)-cluster{i}(1,2))*(CC_init(j,2)-cluster{i}(1,2)))
                   minValue=sqrt((CC_init(j,1)-cluster{i}(1,1))*(CC_init(j,1)-cluster{i}(1,1))+(CC_init(j,2)-cluster{i}(1,2))*(CC_init(j,2)-cluster{i}(1,2)));
                   minNum=i;
               end
           end 
           cluster{minNum}=cat(1,cluster{minNum},CC_init(j,:)); 
       end
       %再次计算簇中心,并与原簇中心进行比较
       flag1=1;
       for n=1:k
           c_base=cluster{n}(1,:);
           c=cluster{n};
           c(1,:)=[];
           cluster{n}(1,:)=mean(c,1); 
           c_base=c_base-cluster{n}(1,:);
           if c_base~=0
               flag1=0;
           end            
       end 
       if flag1==0
           flag=1;
       else
           flag=0;
       end
       count=count+1;       
   end   
   %绘制聚类结果
   for i=1:k
       scatter(cluster{i}(:,1),cluster{i}(:,2),'filled');
       hold on
   end   
end
0 0
原创粉丝点击