≪统计学习精要(The Elements of Statistical Learning)≫课堂笔记(十三)
来源:互联网 发布:广州三支箭网络 编辑:程序博客网 时间:2024/05/17 12:05
本学期最后一堂课的笔记...就这样,每周上班的时候都没有惦念的了,我是有多么喜欢教室和课堂呀。或者说,真的是太习惯学校的生活方式了吧...
这一节主要是在上一节的基础上,介绍一些可加模型或者树模型的相关(改进)方法。
MARS
MARS全称为Multivarible Adaptive Regression Splines,看名字就能猜出来大致他是做啥的。MARS这家伙与CART一脉相承(话说CART的竞争对手就是大名鼎鼎的C4.5)。不过,还是先说一下MARS到底是怎么玩的吧。
数据集依旧记作
,画出图形来就是:
这样就可以定义I函数了:
,越来越有spines味道了是不是?
之后就是定义f函数:
之后,显然有
over-fit的嫌疑,所以开始逐步的减少一些
。
PRIM
PRIM的全称为Patient Rule Induction Method,呃看名字貌似是一种比较耐心的一步步递归的方法。果不其然,最开始就是我们要先定义“削皮”:选取
。
从总体中扔掉这
(以第一次出现的空间为准)。
HME
HME的全称为Hierarchical Mixture of Experts,听起来像是一个智囊团的感觉。画出来呢,就是一个树的形状。
大致的思想就是,以概率分配到各个枝条(软分类器),这样有
。对于最下面一层的expert
net,可以用分类树或者其他任何的分类器。对于HME,可用EM算法来解。两类的情形,就有
,有点像logit的变形有没有?
一句话的总结呢,就是这些方法看上去合理,比较容易follow the intuition,但是树类的结构弄得很难用现有的方法证明原理和一些相关性质(完全非线性呀)。
模型的总结:广义线性模型和基函数模型
从第一章到第九章,我们探索了很多个模型。说到底,模型就是
。
最简单的来说,就是线性模型,形式为
。显然,线性模型便是参数模型。
然后就是广义线性模型(GLM),我们可以先扩张x,就有
这两个空间实现了一种线性的映射关系。
接下来我们就会看到一种形状很类似的树模型,但不是GLM:
远非线性的,而且是变量。
接着参数化,我们就有
- ≪统计学习精要(The Elements of Statistical Learning)≫课堂笔记(十三)
- ≪统计学习精要(The Elements of Statistical Learning)≫课堂笔记(一)
- ≪统计学习精要(The Elements of Statistical Learning)≫课堂笔记(二)
- ≪统计学习精要(The Elements of Statistical Learning)≫课堂笔记(三)
- ≪统计学习精要(The Elements of Statistical Learning)≫课堂笔记(四)
- ≪统计学习精要(The Elements of Statistical Learning)≫课堂笔记(一)
- ≪统计学习精要(The Elements of Statistical Learning)≫课堂笔记(二)
- ≪统计学习精要(The Elements of Statistical Learning)≫课堂笔记(三)
- ≪统计学习精要(The Elements of Statistical Learning)≫课堂笔记(四)
- ≪统计学习精要(The Elements of Statistical Learning)≫课堂笔记(五)
- ≪统计学习精要(The Elements of Statistical Learning)≫课堂笔记(六)
- ≪统计学习精要(The Elements of Statistical Learning)≫课堂笔记(七)
- ≪统计学习精要(The Elements of Statistical Learning)≫课堂笔记(八)
- ≪统计学习精要(The Elements of Statistical Learning)≫课堂笔记(九)
- ≪统计学习精要(The Elements of Statistical Learning)≫课堂笔记(十)
- ≪统计学习精要(The Elements of Statistical Learning)≫课堂笔记(十一)
- ≪统计学习精要(The Elements of Statistical Learning)≫课堂笔记(十二)
- ≪统计学习精要(The Elements of Statistical Learning)≫课堂笔记(十四)
- Nuttx添加自己的应用程序HelloWorld
- 【Android - 框架】之Fresco的使用
- 第1.2章 运行django
- 面向对象、类与对象、成员与局部变量、封装、private、构造函数、this、static、extends、super、final、abstract、interface、多态、内部类、异常【5】
- 每天五分钟玩转opentack 阅读笔记
- ≪统计学习精要(The Elements of Statistical Learning)≫课堂笔记(十三)
- 正则表达式教程
- GIAC 全球互联网架构大会最新日程抢先看!
- JVM-并发-线程安全与锁优化
- kNN-k近邻算法
- ≪统计学习精要(The Elements of Statistical Learning)≫课堂笔记(十四)
- linux curl命令使用
- 代码静态分析工具——splint的学习与使用
- oracle user_tables 系统表