OpenCV官方文档 理解k
来源:互联网 发布:手机淘宝怎么改价格 编辑:程序博客网 时间:2024/05/29 08:32
理解k - means聚类
目标
在这一章中,我们将了解k - means聚类的概念,它是如何工作等。
理论
我们将这个处理是常用的一个例子。
t恤尺寸问题
考虑一个公司要发布一个新模型的t恤。 显然他们将不得不制造模型满足人们各种尺寸的大小不同。 所以公司的数据甚至身高和体重,并把它们放到图,如下:
公司无法为所有的尺寸制作衣服。 相反,他们把人分为小,中和大,只生产这3个模型来适合所有的人的只存。 这种分组方式将把人分为分成三组,而我们可以通过k - means聚类算法提供最好的3个尺寸,这将满足所有的人的需求。 不过如果数据显示三个尺寸并不合适,那么聚类算法也可以进行更多更合适的分类,列如五类。 检查下图:
它是如何工作的呢?
这个算法是一个迭代的过程。 我们将解释它一步一步的帮助下图片。
考虑一组数据如下(你可以认为这是T恤问题)。 我们需要集群数据分成两组。
步骤:1——算法随机选择两个重心,和(有时,任意两个数据作为重心)。
一步:2——它质心计算每个点的距离。 如果一个测试数据更加接近,那么数据标签贴上 0。 如果它是更接近1,然后贴上 1 (如果有更多的重心,贴上2,一个3等)。
在我们的例子中,我们将颜色0 a贴上了红色,和一个1与蓝色的标签。 以上操作后我们得到下面的图像。
一步:3——接下来,我们计算所有蓝色的平均分开点,红点,这将是我们新的重心。 这是和转移到新计算质心。 (记住,显示的图片是不正确的值,而不是真实的身材尺寸,该数据仅供演示)。
再一次,执行步骤2新重心和标签数据0 和 1。
所以我们得到结果如下:
现在- 2步和- 3步是迭代直到重心都是聚合不动点。(也可能停止根据我们提供的标准,如最大迭代数,或达到一个特定的准确性等等)。这些点是测试数据及其对应的质心之间的距离之和最小。 或者只是,之间的距离之和和是最低的。
最终结果几乎看起来像下图:
这是一个直观的理解k - means聚类。 更多细节和数学解释,请阅读任何标准机器学习教科书或检查的额外资源的链接。 它只是一个顶层的k - means聚类。 有很多修改算法,如何选择初始质心,如何加快迭代过程等。
额外的资源
- 机器学习课程视频讲座,教授Andrew Ng(一些图片取自这)
- OpenCV官方文档 理解k
- OpenCV documentation 官方文档
- opencv 各个版本官方文档
- [Docker 官方文档] 理解 Docker
- Android OpenCV 官方文档阅读笔记
- OpenCV官方文档研究(一)Mat
- OpenCV官方文档研究(二)卷积
- 官方文档-opencv训练级联分类器
- pcl,opencv,openni2,Qt5官方文档
- Adapter 官方文档的解释~~~~~~~~~~~~~~~~~好好理解~
- Android File类 根据官方文档理解
- Android File类 根据官方文档理解
- Android File类 根据官方文档理解
- Android File类 根据官方文档理解
- 苹果官方文档:理解和分析ios应用崩溃日志
- extjs学习教程二--怎么理解extjs官方文档
- gradle学习笔记(六) 官方文档笔记+理解
- 【python官方文档】深入理解python函数定义
- UESTC 1593 老司机破阵 优先队列+双端链表
- 对JavaScript中对象字面量的理解
- HTTP 协议详解与HTTP 协议压缩
- Android官方下拉选择控件Spinner
- HDU 1072 Nightmare(搜索-DFS)
- OpenCV官方文档 理解k
- Matlab problems
- 数据库三大功能及包含的sql及数据库的增删改查
- Android平台使用okhttp
- Hibernate中悲观锁和乐观锁详解
- 通用Mapper和分页插件
- 函数指针VS指针函数;数组指针VS指针数组
- Linux——文件描述符与文件管理结构
- LeetCode Reverse Integer