机器学习基石 3-4 Learning with different input space
来源:互联网 发布:数组 push pop 编辑:程序博客网 时间:2024/05/17 23:59
前三节(3-1、3-2和3-3)分别从output space、data label和protocol三个方面对ML Algorithm进行了划分。本节从input space的角度来对ML Algorithm进行区分。
最简单的情况:concrete feature
对于一个给定的input data set,最简单的情况就是能够从给定的特征中提取出需要学习的信息。如上图中Coin Recognition的例子。我们只要简单地从mass和size两个方面就可以对coin所属的class进行分类,而在input space中正好给出的又是这两个feature。这是一种最简单的给出feature的方式,因为我们需要提取的domain knowledge就已经从data的feature中得到了体现。
有可能要进行convert或者transact的情况:raw feature
在这种情况下,通常我们是不能够直接获得所需要的feature的。如图上图给出的digit recognition的问题,input space就是一些图片,我们能够获得的信息仅有图中pixel的信息。单从这些信息是不能直接进行该digit recognition problem的求解的。我们需要再对这些pixel进行convert或者transact的操作(比如计算笔画拐弯处的pixel密度等)才能分析这些pixel信息中带的feature。通常这些convert的行为成为feature engineering,该项工程就是用来将raw feature转化成concrete feature从而进行分析的。
最复杂的情况:abstract feature
最复杂的一种情况,就是我们手中拿到的input data set里边仅存的是极为抽象的数据。就像2011年KDDCUP的题目,我们需要预测用户对每首歌曲的评分,然而我们手上仅有的是用户的ID以及歌曲的ID。这就是一种很抽象的feature的情况,从手上的数据很难直接提取出有用的可用于分析的feature。因此在这种情况下需要对数据进行conversion/extraction/construction等操作才能够获得有用的信息。从KDDCUP的那个例子来说,我们需要从用户的特征提取出他们所喜欢的音乐的feature,再对每首歌进行分析,并将每首歌与这种feature进行匹配,最后通过匹配的程度对每位用户的评分做出prediction。这种情况与raw feature的区别在于这种情况更为复杂,甚至不能通过简单地通过计算进行convert,就像KDDCUP所描述的问题,可能需要用到一些Data Mining的方法才能够对数据进行转化和分析。
0 0
- 机器学习基石 3-4 Learning with different input space
- 机器学习基石-03-4-learning with different Input Space
- 机器学习基石 3.4 Learning with Different Input Space
- 机器学习基石 3-1 Learning with different output space
- 机器学习基石 3.1 Learning with Different Output Space
- 机器学习基石-03-1-learning with different Output Space
- 机器学习基石 3-3 Learning with different protocol
- 机器学习基石 3-2 Learning with different data label
- 机器学习基石-03-3-learning with different Protocol
- Lecture3-3Learning with different input space
- 机器学习基石 3.2 Learning with Different Data Label
- 机器学习基石 3.3 Learning with Different Protocol
- 机器学习基石-03-2-learning with different Data Labels
- 机器学习基石-3-Types of Learning
- Lecture3-1Learning with different output space
- 计算机--机器学习---机器learning基石sum
- 机器学习基石 4-1 Learning is impossible
- 机器学习基石-04-4-Connection to Real Learning
- UCOSIII任务管理
- 阿里云购买、升级主机等产品的云大使优惠券以及阿里云优惠券领取使用
- UILabel常用的属性设置
- swift中类方法创建button等等其他控件
- Java文件路径问题
- 机器学习基石 3-4 Learning with different input space
- 人行征信接口
- 经验分享之tips(1)
- GCDAsyncUdpSocket的简单使用
- LeetCode (Divide Two Integers)
- 项目积累
- 安装 VPN 时遇到msi error 2503的解决办法
- java数据结构与算法分析学习2(泛型--用java5泛型特性视线泛型)
- linux 的java写程序报异常java.net.InetAddress.getLocalHost(InetAddress.java:1505)解决