《机器学习基石》课程笔记(3)
来源:互联网 发布:淘宝图片超链接 编辑:程序博客网 时间:2024/05/17 21:38
不同输出空间下的机器学习输出空间 实际应用 二元分类Y={−1,+1} 信用卡分发或不分发、识别垃圾邮件和非垃圾邮件、病人有病或没病、广告是否盈利、答案是否正确多元分类Y={1,2,3,...,K} 手写字体分类、图片识别、垃圾邮件更详细的分类回归Y=R 或者 Y=[lower,upper]⊂R 根据病人的特征判断还有多长时间痊愈、通过公司数据预测股票价格、根据天气数据预测温度结构化学习(序列标记问题)Y=structures NLP中的词性标注、通过蛋白质数据预测蛋白质的三维结构、将语音数据转化为语音语法树简单介绍 实际应用 有监督学习对于训练集D ,每个xn 都有一个对应的yn ,即训练集中的每个数据的类别是已知的垃圾邮件分类、图片识别无监督学习对于训练集D ,每个xn 没有对应的yn ,即训练集中的每个数据的类别是未知的,需要机器自己判断聚类问题(相当于无监督的多元分类)、密度估计(相当于无监督的有界回归)、离群点检测(相当于无监督的二元分类)半监督学习对于训练集D ,有一部分xn 存在对应的类标号yn ,而另一部分xn 则没有对应的类标号yn 。让机器不依赖外界交互,自动的利用未标记的样本提升学习性能。适用于有标记数据少,无标记数据多的情况。计算机辅助医学影象分析、人脸识别强化学习强化学习类似于宠物训练,通过对机器的一系列“惩罚”和“奖励”来实现性能提升。一般来说,强化学习的输入数据是时序化、部分的。广告推荐、机器人学习机器学习问题 简单介绍 批量学习把所有已知的数据一次性的喂给机器,又称填鸭式学习。这是一种很常见的学习方式。在线学习首先输入一个xt ,机器根据当前假设预测出gt(xt) ,然后从用户那里得到xt 的真实类别yt ,用(xt,yt) 更新gt 。一般来说,数据的输入是序列化的,即一个一个输入。主动学习类似于半监督学习,训练集D 中有一部分xn 存在对应的类标号yn ,而另一部分xt 则不存在对应的yt 。对于一个没有类标号的xt ,机器主动向专家询问xt 的类标号yt ,然后利用新获得的只是训练分类器和进行下一轮询问。不同的输入空间 简单介绍 具体数据输入空间X⊆Rd 的每一个维度都有复杂的现实含义,通常输入的数据都带有人类的智慧,即被人类描述过得数据。机器学习这些数据是相对比较简单的。原始数据输入空间X⊆Rd 的每一个维度具有普通的现实含义,比如音频识别中得到的音频,相对来说机器学习的难度也会增加。我们需要把这些原始数据转化为具体数据,这个工作可以由机器完成,也可以由人类完成。由机器完成的叫做深度学习,由人类完成的叫做特征工程。抽象数据输入空间X⊆Rd 的每一个维度没有或者只有很少现实含义,比如在线广告系统中的广告ID。对于机器来说这种学习是最困难的,这时候就需要更多的特征工程。
阅读全文
0 0
- 《机器学习基石》课程笔记(3)
- 机器学习基石(林轩田)课程笔记
- 《机器学习基石》课程笔记(1)
- 《机器学习基石》课程笔记(2)
- 《机器学习基石》课程笔记(4)
- 台湾大学林轩田机器学习基石课程学习笔记14 -- Regularization
- 台湾大学林轩田机器学习基石课程学习笔记15 -- Validation
- 台湾大学林轩田机器学习基石课程学习笔记
- 台湾大学林轩田机器学习基石课程学习笔记3 -- Types of Learning
- 台湾大学林轩田机器学习基石课程学习笔记16(完结) -- Three Learning Principles
- 机器学习基石笔记
- 机器学习基石学习笔记3 VC Dimension(1)
- 分享 机器学习基石笔记
- 机器学习基石笔记--1
- 机器学习课程3-笔记
- 台湾大学林轩田机器学习基石课程学习笔记2 -- Learning to Answer Yes/No
- 台湾大学林轩田机器学习基石课程学习笔记4 -- Feasibility of Learning
- 台湾大学林轩田机器学习基石课程学习笔记5 -- Training versus Testing
- day20笔记
- 堆排序
- mysql sql语句大全
- 线性顺序表
- ②看视频学习NDK之C函数指针
- 《机器学习基石》课程笔记(3)
- 我的智能家庭----启航
- 【H264】详细介绍
- C++中的一些基础概念及解析(含构造函数与析构函数)
- 基础练习 十六进制转十进制
- 堆介绍
- 有关于echarts的一些东西
- 常用的Mysql数据库操作语句大全
- intellj 使用