《机器学习基石》笔记:第一讲
来源:互联网 发布:直销双轨会员系统源码 编辑:程序博客网 时间:2024/05/29 18:59
林轩田老师的《机器学习基石》和《机器学习技法》两门课程非常经典,从哲学原理讲到算法核心,深入浅出,非常详细。但存在两个问题:
1.林老师是台湾(省)人,很多舶来品词语的翻译和大陆不同,加上林老师讲的比较快,一次听明白还是不容易的。
2.由于课程是视频形式,回头复习比较麻烦。 因此,想把每节课的重要内容以笔记的形式记录下来,以供未来反复回头翻看。希望能坚持下来:)
下面开始正式内容。
1.课程介绍
本课程目的是“基石”导向的,力求学习者通晓原理又熟悉技巧,既不是枯燥的将理论,也不是速成式的讲算法(算法那么多,怎么学也学不完)。
2.什么是机器学习?
人类的学习过程是从大量经验中,通过观察学到技能。机器学习则是计算机(模型)从大量数据(data)中学到技能(skill)。
那么,什么是skill?skill就是在一个业务场景中提升某个指标,比如在股票投资中,模型通过大量data学习,使得投资者的股票回报率提高了,那么这就是学到了skill。
那么,为什么我们要使用机器学习(用其他的技术不行吗)?比如说要你在1000张图片中分辨哪些图片中包含树。此时,通过编写规则难以做到,我们无法(很难)将树的定义用数学抽象表达。因此,此类场景需要机器学习。
那么,使用机器学习的关键是什么?(1)存在潜在的模式(pattern)可供学习(2)人工编写规则难以做到(3)存在足量的该pattern生成的data。
机器学习的应用涵盖了我们的衣食住行教育娱乐等日常生活,典型应用有NLP、IR、RS等。
那么,一个机器学习应用包含哪些基本成分?(1)input:X(2)output:Y(3)f:X–>Y(f代表pattern,也就是我们未知但是想求出的一种对应法则)(4)training set:D(5)hypothesis set(假设空间),也就是g的全集。(5)g:X–Y(我们想求得f但是求之不得,所以通过data求一个近似于f的g来代替f)
3.机器学习的流程:
那么,机器学习和数据挖掘、人工智能、统计学等这些学科领域的关系是怎样的?
首先,机器学习是希望通过data来近似求得一个和f相似的g。
而数据挖掘则是通过data发掘有趣(interesting)的事情,数据挖掘包含的范围更大。
其次,机器学习是(目前看来)实现人工智能的一个最佳途径。
最后,机器学习里面使用的很多方法都是统计学家在很早以前发现的。统计学领域更注重用数学方法预测假设,不太重视大量的数据计算。
- 《机器学习基石》笔记:第一讲
- 台湾国立大学的《机器学习基石》第一讲 笔记
- 机器学习基石第一讲:PLA
- 《机器学习基石》笔记:第二讲
- 《机器学习基石》笔记:第三讲
- 机器学习基石-林轩田 第五讲笔记
- 听课笔记(第一讲):台湾国立大学的《机器学习基石》(Coursera 版)
- 机器学习基石第一讲:the learning problem
- 《机器学习基石》第2讲 学习笔记
- 《机器学习基石》 第7讲 学习笔记
- 机器学习基石笔记
- 听课笔记(第三讲): 机器学习的分类学 (台湾国立大学机器学习基石)
- 台湾国立大学机器学习基石.听课笔记(第三讲): 机器学习的分类
- 台湾国立大学机器学习基石.听课笔记(第四讲): 机器学习的可行性
- 台湾国立大学机器学习基石.听课笔记(第四讲): 机器学习的可行性
- 机器学习基石第九讲:linear regression
- 机器学习第一讲
- 机器学习 第一讲
- bzoj 1409: Password 矩阵乘法+线性筛
- 5种服务器网络编程模型
- python3中input输入浅谈
- 学习JavaScript数据结构与算法(五)——集合
- python-破解
- 《机器学习基石》笔记:第一讲
- nodejs Web服务(Express)
- 数据结构通过链栈实现字符串中心对称匹配
- 02-线性结构1 两个有序链表序列的合并(15 分)
- 16.Oracle杂记——Oracle诊断内存命中脚本
- 【bzoj 1012】最大数maxnumber(线段树)
- 卡尔曼滤波简介
- 软考之路---数据流图
- 17.Oracle杂记——Oracle诊断表索引监控脚本