《机器学习基石》笔记:第一讲

来源:互联网 发布:直销双轨会员系统源码 编辑:程序博客网 时间:2024/05/29 18:59

林轩田老师的《机器学习基石》和《机器学习技法》两门课程非常经典,从哲学原理讲到算法核心,深入浅出,非常详细。但存在两个问题:
1.林老师是台湾(省)人,很多舶来品词语的翻译和大陆不同,加上林老师讲的比较快,一次听明白还是不容易的。
2.由于课程是视频形式,回头复习比较麻烦。 因此,想把每节课的重要内容以笔记的形式记录下来,以供未来反复回头翻看。希望能坚持下来:)
下面开始正式内容。


1.课程介绍
本课程目的是“基石”导向的,力求学习者通晓原理又熟悉技巧,既不是枯燥的将理论,也不是速成式的讲算法(算法那么多,怎么学也学不完)。
2.什么是机器学习?
人类的学习过程是从大量经验中,通过观察学到技能。机器学习则是计算机(模型)从大量数据(data)中学到技能(skill)。
那么,什么是skill?skill就是在一个业务场景中提升某个指标,比如在股票投资中,模型通过大量data学习,使得投资者的股票回报率提高了,那么这就是学到了skill。
那么,为什么我们要使用机器学习(用其他的技术不行吗)?比如说要你在1000张图片中分辨哪些图片中包含树。此时,通过编写规则难以做到,我们无法(很难)将树的定义用数学抽象表达。因此,此类场景需要机器学习。
那么,使用机器学习的关键是什么?(1)存在潜在的模式(pattern)可供学习(2)人工编写规则难以做到(3)存在足量的该pattern生成的data。
机器学习的应用涵盖了我们的衣食住行教育娱乐等日常生活,典型应用有NLP、IR、RS等。
那么,一个机器学习应用包含哪些基本成分?(1)input:X(2)output:Y(3)f:X–>Y(f代表pattern,也就是我们未知但是想求出的一种对应法则)(4)training set:D(5)hypothesis set(假设空间),也就是g的全集。(5)g:X–Y(我们想求得f但是求之不得,所以通过data求一个近似于f的g来代替f)
这里写图片描述
3.机器学习的流程:
这里写图片描述
那么,机器学习和数据挖掘、人工智能、统计学等这些学科领域的关系是怎样的?
首先,机器学习是希望通过data来近似求得一个和f相似的g。
而数据挖掘则是通过data发掘有趣(interesting)的事情,数据挖掘包含的范围更大。
其次,机器学习是(目前看来)实现人工智能的一个最佳途径。
最后,机器学习里面使用的很多方法都是统计学家在很早以前发现的。统计学领域更注重用数学方法预测假设,不太重视大量的数据计算。

阅读全文
0 0
原创粉丝点击
热门问题 老师的惩罚 人脸识别 我在镇武司摸鱼那些年 重生之率土为王 我在大康的咸鱼生活 盘龙之生命进化 天生仙种 凡人之先天五行 春回大明朝 姑娘不必设防,我是瞎子 快递邮寄东西坏了怎么办 快递被别人拆了怎么办 淘宝买的东西包装破损怎么办 寄血液被退回来怎么办 快递被安检扣了怎么办 淘宝原单退回运费怎么办 运输过程中包裹破损怎么办 天猫没收到货签收怎么办 收到的快递坏了怎么办 自寄的快递少了怎么办 邮的东西弄坏了怎么办 物流签收后发现货物损坏怎么办 发现客人损坏了酒店物品怎么办 东西坏了签收了怎么办 朋友圈贩卖三无产品你怎么办 付钱给微商没有保障怎么办 电镀锌钢带生锈怎么办 电机机油从空气滤芯里流出怎么办 把塑料皮套吃了怎么办 塑料框眼镜有点小了怎么办 出口纸箱打了钉怎么办 买房子交款单据丢了怎么办 买房子所有单据丢失怎么办 车险单据都丢了怎么办 真空包装的东西里面有空气怎么办 发货物忘记写唛头了怎么办 Word文档撤销按钮删除了怎么办 ai保存时未响应怎么办 ai还没保存卡了怎么办 ai卡住了没保存怎么办 屁股沟有硬块红肿怎么办 卧室床选太大了怎么办 画板的笔尖掉了怎么办 宜家水壶盖子有水怎么办 背滤鱼缸除油膜怎么办 书多了没地方放怎么办 学生在教室内丢手机怎么办 新车尾箱坏了怎么办 放书的箱子烂了怎么办 车钥匙锁后备箱里怎么办 布的收纳箱有味怎么办