Machine Learning机器学习课堂笔记2(监督学习与无监督学习)

来源:互联网 发布:形容傻天真网络词 编辑:程序博客网 时间:2024/04/29 23:54
1.监督学习
监督学习指的就是我们给学习算法一个数据集,这个数据集由“正确答案”组成。基本思想是,我们数据集中的每个样本都有相应的“正确答案”,再根据这些样本作出预测。算法有回归、分类等等。   
  
答案选择第三个
2.非监督学习
在无监督学习中我们用的数据会和监督学习里的看起来有些不一样,在无监督学习中没有属性或标签这一概念,也就是说所有的数据都是一样的,没有区别,所以在无监督学习中,我们只有一个数据集,没人告诉我们该怎么做,我们也不知道每个数据点究竟是什么意思,相反,它只告诉我们现在又一个数据集你能在其中找到某种结构吗?对于给定的数据集无监督学习算法可能判定该数据集包含两个不同的聚类,你看,这是第一个聚类  
  
然后这是另一个聚类   
      
你猜对了 无监督学习算法会把这些数据分成两个不同的聚类,所以这就是所谓的聚类算法,实际上它被用在许多地方,我们来举一个聚类算法的例子,Google新闻的例子如果你还没见过这个页面的话你可以到这个URL news.google.com去看看  
  
谷歌新闻每天都在干什么呢?他们每天会去收集成千上万的网络上的新闻然后将他们分组,组成一个个新闻专题,比如让我们看看这里   
       
这里的URL链接连接着不同的有关BP油井事故的报道,所以让我们点击这些URL中的一个,恩,让我们点一个      
     
然后我们会来到这样一个网页这是一篇来自华尔街日报的有关BP油井泄漏事故的报道标题为《BP杀死了Macondo》Macondo是一个地名,就是那个漏油事故的地方,如果你从这个组里点击一个不同的URL,那么你会得到不同的新闻      
       
这里是一则CNN的新闻,是一个有关BP石油泄漏的视频,如果你再点击第三个链接,又会出现不同的新闻     
     
这边是英国卫报的报道也是关于BP石油泄漏,所以谷歌新闻所做的就是去搜索成千上万条新闻,然后自动的将他们聚合在一起,因此有关同一主题的新闻被显示在一起,其实聚类和无监督学习算法也可以被用于许多其他的问题          
      
聚类只是无监督学习的一种,现在介绍另一种,先来介绍一下鸡尾酒宴问题,有夜歌宴会,有一屋子的人大家都坐在一起而且在同时说话有许多声音混杂在一起,因为每个人都是在同一时间说话的,在这种情况下你很难听清楚你面前的人说的话,因此,比如有这样一个场景,宴会上只有两个人,两个人同时说话,网民们准备了两个麦克风把他们放在房间里,然后,因为这两个麦克风距离这两个人的距离是不同的,每个麦克风都记录下了来自两个人的声音的不同组合,也许A的声音在第一个麦克风里的声音会响一点,也许B的声音在第二个麦克风里会比较响一些,    
       
因为2个麦克风的位置相对于2个说话者的位置是不同的,但每个麦克风都会录到来自两个说话者的重叠部分的声音,无监督学习算法将会将重叠部分的声音分离开来
代码:  
    
课程使用Octave的编程环境,Octave是一个免费的开放源码的软件,使用Octave或Matlab这类的工具,许多学习算法都可以用几行代码就可以实现。
svd意思是奇异值分解,但这其实是解线性方程的一个惯例,它被内置在Octave软件中了,如果你试图在C++或Java中做这个将需要写N多代码,并且还要连接复杂的C++或Java库,所以,你可以再C++或Java或Python中实现这个算法,只是会更加复杂而已
无监督学习是一种学习机制,你给算法大量的数据,要求它找出数据中蕴含的类型结构。    
      
选择第二个和第三个。
0 0
原创粉丝点击