python sklearn包——cross validation笔记
来源:互联网 发布:微信抢号软件 编辑:程序博客网 时间:2024/06/02 02:07
preface:做实验少不了交叉验证,平时常用from sklearn.cross_validation import train_test_split,用train_test_split()函数将数据集分为训练集和测试集,但这样还不够。当需要调试参数的时候便要用到K-fold。scikit给我们提供了函数,我们只需要调用即可。
sklearn包中cross validation的介绍:在这里。其中卤煮对3.1.2. cross validation iterators这一小节比较注意。先做这一小节的笔记,后续再添加。cross_validation函数下的函数如下图所示。
Figure 1: cross validation下的函数
3.1.2.1. k-fold
将样例划分为K份,若K=len(样例),即为留一交叉验证,K-1份作为训练。从sklearn中自带的KFold函数说明中也可以看到其用法。其中n_folds默认为3折交叉验证,2/3作为训练集,1/3作为测试集。
Figure 3-1-2-1-1:KFold用法
Figure 3-1-2-1-2: KFold使用例子
3.1.2.2. Stratified k-fold
StratifiedKFold()这个函数较常用,比KFold的优势在于将k折数据按照百分比划分数据集,每个类别百分比在训练集和测试集中都是一样,这样能保证不会有某个类别的数据在训练集中而测试集中没有这种情况,同样不会在训练集中没有全在测试集中,这样会导致结果糟糕透顶。
Figure 3-1-2-2-1:StratifiedKFold函数使用
3.1.2.3. Label k-fold
LabelKFold()函数则是根据样例label来交叉验证,某个样例的数据必须是属于训练集或者测试集时,可用这个函数。奇怪的是卤煮在sklearn中使用异常,没有这个函数。。。
Figure 3-1-2-3:LabelKFold()函数使用
- python sklearn包——3.1cross validation笔记
- python sklearn包——cross validation笔记
- python sklearn包——cross validation笔记
- python sklearn包——cross-validation
- sklearn学习笔记1---cross-validation
- 机器学习-->sklearn.Cross-validation
- python sklearn包——grid search笔记
- python sklearn包——grid search笔记
- sklearn学习记录三:cross-validation
- 机器学习-sklearn库的Cross Validation
- sklearn中的交叉验证(Cross-Validation)
- Cross validation的一点笔记
- 机器学习(五)使用sklearn库的cross validation
- Python如何进行cross validation training
- 笔记-cross validation(交叉验证)
- 斯坦福大学机器学习——交叉验证(Cross Validation)
- 斯坦福大学机器学习——交叉验证(Cross Validation)
- Cross Validation
- 微信授权登陆
- 图中奇点数量不可能有奇数个的证明
- TCP同步与异步及阻塞模式,多线程+阻塞模式,非阻塞模式简单介绍
- XCode8.1控制台不打印东西
- Aerospike数据库配置
- python sklearn包——cross validation笔记
- 【bzoj 1012】[JSOI2008]最大数maxnumber(线段树||st表)
- #392 – 使用SnapsToDevicePixels 属性消除抗锯齿效果(Use SnapsToDevicePixels Property to Prevent Anti-Aliasing)
- Spring@Autowired注解与自动装配
- C++文件长度
- Android设计模式系列(2)--SDK源码之观察者模式
- MySQL索引
- 服务器的瞬时 diffiehellman 公共秘钥过弱
- angularjs-表单验证事件