KNN(NearestNeighbor)临近算法,自然语言讲解

来源:互联网 发布:淘宝优惠券在哪领 编辑:程序博客网 时间:2024/05/20 20:48

                                                   knn临近算法理解

其实算法理解起来也并没有那么难,主要是可能我们接触的一些数学公式或者是一些代码我们看不懂而已,其实用自然语言描述起来其实挺好理解的


   .首先我们用knn算法来实现一个案例吧,这个案例也是我从资粮上看到的,不过我用通俗易懂的语言把它描述出来

   这是一个关于一个女性朋友在相亲的网站上需要找出自己可能会感兴趣的人,通过一些特征向量初步判断自己是否有兴趣和他继续交流下去

 1)我们初步统计了,这位女性朋友以前所喜欢的的类型,初步列出了三个特征向量,

      ①每年的航班里程

      ②打游戏和看视屏占用的时间百分比

      ③吃冰淇淋的升数每周

  2)利用knn算法我们统计计算我们需要预测的值(用向量表示)靠近我们最近的向量是那些(k个)然后,每个向量占分类的百分比,选择比重较大的那个分类

       ①我们需要获取测试数据(三个特征值,以及他们的分类结果)

       ②将特征向量装换成knn算法课操作的数据类型

       ③为了避免某种特征值因为数据大而过分影响距离的计算(欧几里公式,点到点的距离),统一化特征

       ④用①的数据来算出我们这个算法的错误率是多少

       ⑤当错误率较小时,满足我们所定义的标准时,然后拿来测试我们想要预测的

       ⑥结果可以输出到文件,也可以在控制台打印,当然最好还是可以利用mlibplot这种第三方库用图像显示出来,这样更直观

原创粉丝点击