scikit-learn:4.1. Pipeline and FeatureUnion: combining estimators(特征与预测器结合;特征与特征结合)
来源:互联网 发布:淘宝买家黑名单 编辑:程序博客网 时间:2024/06/06 20:06
带病在网吧里写,,,,给点鼓励吧。。。
http://scikit-learn.org/stable/modules/pipeline.html
1、pipeline和featureUnion是干什么的:
pipeline之前已经介绍过了,结合transformer和estimator。
featureUinon听名字就知道,将多个transformer的结果vector拼接成大的vector。
2、两者的区别:
前者相当于feature串行处理,后一个transformer处理前一个transformer的feature结果;
后者相当于feature的并行处理,将所有transformer的处理结果拼接成大的feature vector。
3、pipeline:chaining estimators
Pipeline can be used to chain multiple estimators into one. 因为我们处理数据的过程一般都是比较固定的,比如特征选择、规范化、分类。所以pipeline主要由两个目的:
方便:fit、predict一次即可处理所有estimators的结果。
拼接参数选择:仅需一次即可grid search所有estimators的所有parameters。
pipeline的所有的estimators(除了最后一个)都必须是transformer(有transform方法),最后一个estimator可以使任何类型(transformer、classifier)
使用:通过一组(key, value)对来串联所有的estimators,key是自己对每一步骤的随意的命名,value是一个estimator object,例如:
每一个阶段的estimators存放在steps属性中,可以通过索引这样取出每一个estimators: 也可以通过name这样取出每一个estimators(as a dict in named_steps:):想改变estimators的parameter值?用这样的语法:<estimator>__<parameter> syntax,例如:
终极目的,grid searches:
最经典的文本分类来了:
Notes:重要的事情不翻译,
Calling fit on the pipeline is the same as calling fit on each estimator in turn, transform the input and pass it on to the next step.
Thepipeline has all the methods that the last estimator in the pipeline has, i.e. if the last estimator is a classifier, the Pipeline can be used as a classifier. If the last estimator is a transformer, again, so is the pipeline.
4、FeatureUnion:composite feature spaces
featureUnion描述,重要的不翻译:
FeatureUnion combines several transformer objects into a new transformer that combines their output. A FeatureUnion takes a list of transformer objects. During fitting, each of these is fit to the data independently. For transforming data, the transformers are applied in parallel, and thesample vectors they output are concatenated end-to-end into larger vectors.
featureUnion和pipleline同样是为了方便和joint parameter,两者也可以结合成更加复杂的模型。
(featureUnion不管两个transformers是否产生相同的特征,他仅仅简单的拼接所有的特征,判重工作还是要你自己来做的。。。)
使用:通过一组(key, value)对来串联所有的estimators,key是自己对每一步骤的随意的命名,value是一个estimator object,例如:
最后给个例子:
http://scikit-learn.org/stable/auto_examples/feature_stacker.html#example-feature-stacker-py
感谢
完,看来以后提取特征有可以省很多事了。。。。。。。。
- scikit-learn:4.1. Pipeline and FeatureUnion: combining estimators(特征与预测器结合;特征与特征结合)
- 【Scikit-Learn 中文文档】Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器
- 【Scikit-Learn 中文文档】Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器
- 【Scikit-Learn 中文文档】Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器
- 【Scikit-Learn 中文文档】Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器
- 【Scikit-Learn 中文文档】Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器
- 【Scikit-Learn 中文文档】Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器
- 【Scikit-Learn 中文文档】Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器
- 【Scikit-Learn 中文文档】Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器
- 【Scikit-Learn 中文文档】Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器
- 【Scikit-Learn 中文文档】Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器
- 【Scikit-Learn 中文文档】Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器
- 【Scikit-Learn 中文文档】Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器
- 【Scikit-Learn 中文文档】Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器
- 【Scikit-Learn 中文文档】Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器
- 【Scikit-Learn 中文文档】Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器
- 【Scikit-Learn 中文文档】Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器
- 【Scikit-Learn 中文文档】Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器
- 算法之动态规划
- hdu2191 — 悼念512汶川大地震遇难同胞——珍惜现在,感恩生活 (多重背包)
- iOS 用代码添加模态视图
- 人丑就要多读书(13)
- extendGcd,即扩展欧几里得算法的C++模板化解释
- scikit-learn:4.1. Pipeline and FeatureUnion: combining estimators(特征与预测器结合;特征与特征结合)
- c语言编程
- poj_1753_高斯消元
- C语言11 -- 函数指针
- LeetCode(29)Divide Two Integers
- iOS开发 ----- C文件读写,以及字符串分割
- 来京学习第8天
- hdu 5288 OO’s Sequence
- 暑假集训第二周——贪心 B - Ride to School