笔记
来源:互联网 发布:radium for mac 编辑:程序博客网 时间:2024/06/16 17:21
分类和聚类
之前分享了一篇博客,人工智能的深渊。这个深渊分成了几层
这次分享两个第二层的简单概念:聚类和分类。
聚类
将给定的样本按照相似性归成若干类。
例如:
从天府三街地铁口找出100个人,根据他们的 身高,年龄,性别, 头发颜色,体型,服饰......, 按照相似性将他们分成若干组,但是不指定具体几个组,也不指定每个组有什么特点。
分类
将给定样本,分到指定的若干个类。
分类需要事先利用大量样本进行训练,找到一个分类的方法。
例如:
现有1000个人的资料或者照片, 包括 身高,年龄,性别, 头发颜色,体型,服饰......,, 而且知道这100个人的职业。
现在我们根据这1000的信息,学习出一个经验,即 根据 身高,年龄,性别, 头发颜色,体型,服饰......,,就能大概地判断出一个人的职业。
然后某天早上从天府三街地铁口随机找100个人,问出他们的 身高,年龄,性别, 头发颜色,体型,服饰......,, 但不问职业,我们也能判断出这些人的是程序员,会计,医生......。
上面所说的经验就是一个分类器。
已知职业的1000个人叫训练样本。