笔记

来源:互联网 发布:radium for mac 编辑:程序博客网 时间:2024/06/16 17:21

分类和聚类

之前分享了一篇博客,人工智能的深渊。这个深渊分成了几层




这次分享两个第二层的简单概念:聚类和分类。



聚类

将给定的样本按照相似性归成若干类。

例如:

从天府三街地铁口找出100个人,根据他们的 身高,年龄,性别, 头发颜色,体型,服饰......,  按照相似性将他们分成若干组,但是不指定具体几个组,也不指定每个组有什么特点。



分类

将给定样本,分到指定的若干个类。 

分类需要事先利用大量样本进行训练,找到一个分类的方法。


例如:

现有1000个人的资料或者照片, 包括 身高,年龄,性别, 头发颜色,体型,服饰......,,  而且知道这100个人的职业。

现在我们根据这1000的信息,学习出一个经验,即 根据 身高,年龄,性别, 头发颜色,体型,服饰......,,就能大概地判断出一个人的职业。

然后某天早上从天府三街地铁口随机找100个人,问出他们的 身高,年龄,性别, 头发颜色,体型,服饰......,, 但不问职业,我们也能判断出这些人的是程序员,会计,医生......。


上面所说的经验就是一个分类器

已知职业的1000个人叫训练样本





原创粉丝点击