机器学习笔记(一)

来源:互联网 发布:k均值聚类算法 matlab 编辑:程序博客网 时间:2024/05/22 15:38
1.什么是机器学习?
 Arthur Samuel described it as : the field of study that gives computers the ability to learn without being explicity programmed.
机器学习分为监督学习和非监督学习。

2.什么是监督学习?
答:“right answer”given。即需要部分数据集已经有正确的答案,比如给定房价的数据集,对于里面的每个数据,算法都知道对应的正确房价,即这房子实际的卖出价格。监督学习又叫回归问题(即回归属于监督中的一种)
Regression:Predict continuous valued output(price)
已知部分肿瘤大小与肿瘤良性的一些数据,现在给出一个肿瘤大小判断其是否为良性肿瘤,这是一个分类问题。

分类:预测目标离散值输出(通常是0、1)
回归:预测目标连续值输出(通常是连续值)
监督学习:训练集有正确的答案

监督学习分为两类:
(1)回归
     trying to predict results within a continuous. 
(2)分类
     trying to predict results within a discrete output.

3.什么是非监督学习?
在无监督学习中,没有属性或标签这一概念,即所有的数据都是一样的,没有区别。
应用:Organize computing clusters ; Social network analysis ; Market segmentation ; Astronomical data analysis
鸡尾酒宴,基因,网页分类
unsupervised learning allows us to approach problems with little or no idea what our results should look like.

4.回归模型(regression model)
   
      
      

5.代价函数(cost function)
     
 
   
0 0
原创粉丝点击