台湾大学机器学习基石lecture1小结

来源:互联网 发布:java 解析swf 编辑:程序博客网 时间:2024/06/16 11:07

最近在学习台湾大学林轩田老师的机器学习基石课程,在lecture1中,老师讲述了when can machine learn?提出了三个判断是否使用机器学习的关键:

1、有更好的输出表现

2、不知道如何写规则(但数据集应该包含规则)

3、最重要的便是要有资料data

针对机器学习在生活中的应用,举一个例子来说,假如我们要写一个movie推荐系统,那么一个可用的pattern可以是:找到data,从data中获取受欢迎的movie特征,例如动作片、喜剧片、爱情片等等,从观众角度来说,可能是该movie中存在观众喜欢的演员或者观众喜欢的bgm等等,这个应该就是特征提取了吧,根据特征构造机器学习模型,来写出movie推荐系统程序。

ML中learning的基本组成部分,有input X       output Y      target function fhypothesis Hdata(训练集)以及g。

一个一般的机器学习模型如下:



其中,假设集合可能有1个元素,也可能存在无穷多个元素,比如很多个元素的时候,那么学习算法的作用就是从这么多的hypothesis中找出一个使输出表现的最优秀的hypothesis,使g=该hypothesis,并且近似等于目标函数f。

由于第一次写博客,实在生疏,作为自己学习机器学习的脚印吧!

原创粉丝点击