《Machine Learning》第一讲 监督/非监督学习

来源:互联网 发布:淘宝hd停止服务 编辑:程序博客网 时间:2024/06/05 09:00

 1.Supervised Learning

        给出了实际的输入与输出的结果,然后寻找一个与实际数据相匹配的算法,给出大量的训练样本,来不断的训练这个算法,以至于能够更精确的预测未知结果的用户输入。换句话来说,就是我们给了一组标准输入与标准输出,希望能够从中学习到一个匹配度高的算法,从而在输入未知数据时能够输出更为标准的答案。

       Regression problem(回归问题)

      训练样本是一系列连续变量的值,用来预测的值也是连续的,所以称为回归问题。

       Classification problem(分类问题) 

       处理一些离散、不连续的数据,数据的属性越多,所建立的坐标系的维数就越高,处理多维数据的聚类问题,就需要用到SVM(支持向量机)的技术,来讲多维数据映射到无限维空间

 

 2.Unsupervised Learning

       给出一系列未知结果的数据,也就是说没有加lable的data,来让计算机学习出一个算法,来识别出这片数据之间的联系与区别,主要是完成聚类操作,这个方法在图片的识别(像素的聚类)、社会网络划分、市场划分,语音的提取(混杂的语音解析出一个个单个的语音)




3.Reinforcement Learning

        强化学习主要是基于一个reward system(奖励/回报机制),通过定义什么是好的行为,什么是坏的行为,来对机器进行reward 或者punishment,之后就是需要一个学习型算法来弄清楚如何最大化的获取奖励、最小化的受到惩罚。(形象的理解如同训练一只狗一样,想让狗做什么事,做到了就奖励,没做到就惩罚,从而训练狗做你让它做的事)


阅读全文
0 0
原创粉丝点击