An Entropy Weighting k-Means Algorithm for Subspace Clustering of High-Dimensional Sparse Data
来源:互联网 发布:淘宝联盟登录 编辑:程序博客网 时间:2024/05/21 06:12
本内容整理自 An Entropy Weighting k-Means Algorithm for Subspace Clustering of High-Dimensional Sparse Data
前一篇论文Automated Variable Weighting in k-Means Type Clustering里面的WKMeans算法说到如何选择有用的特征维度(subspace),但有一个问题就是:在那篇文章中,选择后的subspace将用于对所有簇进行聚类。例如,某数据集,其特征维度
但这将出现一个问题就是:如果每一个簇中,起主要作用的维度不相同怎么办?
例如:在对新闻文章进行聚类的时候。假定某数据集有三类,k=1为体育,k=2为政治,k=3为经济,其特征维度
1.EWKM算法的代价函数:
其中:
红色项称为:within cluster dispersions
蓝色项称为:negative weight entropy
下图为
这就解释了为什么文章中说最大化蓝色项了,因为蓝色项小于零,最大化后就接近于零,这样整个代价值才最接近最小。
2.权重
关于公式推导及
3.初始化变量:
先初始化变量
4.迭代求解变量:
①固定
②固定
③固定
4.公式推导:
这篇文章推导公式所用到的方法同上一篇一样,都是采用的拉格朗日乘数法
关于:
有如下数据集:
两个簇的中心点
下面来分步计算:
由此得到:
将上面的形式旋转一下:
我么可以发现:
矢量化为:
for k = 1:K %% computing D % in each iteration, computing the kth row of D. index = find(Xy(:,n+1)==k);% firstly,find all points's index belong to kth cluster temp = X(index,:);% take out all points belong to kth cluster from X square = (temp - centroids(k,:)).^2; D(k,:) = sum(square);end
matlab源码
- An Entropy Weighting k-Means Algorithm for Subspace Clustering of High-Dimensional Sparse Data
- Automated Variable Weighting in k-Means Type Clustering
- Geometry clustering using K-Means algorithm
- Selecting Features for Classifying High-dimensional Data
- 可视化系列论文【INFUSE: Interactive Feature Selection for Predictive Modeling of High Dimensional Data】
- K均值聚类算法(K-Means Clustering Algorithm)
- k均值聚类算法(The k-means clustering algorithm)
- Study notes for Clustering and K-means
- 【Data Algorithms_Recipes for Scaling up with Hadoop and Spark】Chapter 12. K-Means Clustering
- Machine Learning—The k-means clustering algorithm
- Fast Supervised Hashing with Decision Trees for High-Dimensional Data
- High Dimensional Pattern Recognition via Sparse Representation
- Clustering (1): k-means
- K-Means Clustering
- k-means Clustering
- Clustering (1): k-means
- K-Means Clustering算法
- Understanding K-Means Clustering
- 吴恩达Coursera深度学习课程 DeepLearning.ai 提炼笔记(2-3)-- 超参数调试 和 Batch Norm
- WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform...
- 2.5 Linux启动
- 不知道什么时候
- 安装mysql
- An Entropy Weighting k-Means Algorithm for Subspace Clustering of High-Dimensional Sparse Data
- Java学习笔记(第二章)
- 关于equals方法和“==”的个人理解
- drawerlayout 侧拉菜单
- bex5学习
- 评职称如何发表论文
- 强制类型转换
- 【算法】蛇形填数
- poj-1350Cabric Number Problem