python使用grid-search调参
来源:互联网 发布:java动态代理模式 编辑:程序博客网 时间:2024/06/03 18:49
博文参考:http://blog.csdn.net/abcjennifer/article/details/23884761
目标就是解决:
vectorizer取多少个word呢?
预处理时候要过滤掉tf>max_df的words,max_df设多少呢?
tfidftransformer只用tf还是加idf呢?
classifier分类时迭代几次?学习率怎么设?
……..
本文对随机梯度下降和svm(rbf)进行了调参,针对的是知网期刊的文章分类。
需要注意的是:print sorted(pipeline.get_params().keys())
pipeline = Pipeline([
(‘vect’,CountVectorizer()),
(‘tfidf’,TfidfTransformer()),
(‘clf’,svm.SVC()),
]);
parameters = {
“clf__C”:[0.1, 1, 10],
“clf__gamma”: [1, 0.1, 0.01]
}
名字要对应。
随机梯度下降结果如下:
*************************Feature Extraction*************************Performing grid search...('pipeline:', ['vect', 'tfidf', 'clf'])parameters:{'clf__n_iter': (10, 50), 'clf__alpha': (1e-05, 1e-06), 'tfidf__use_idf': (True, False), 'vect__max_features': (None, 5000, 10000), 'vect__max_df': (0.5, 0.75)}Fitting 3 folds for each of 48 candidates, totalling 144 fits[Parallel(n_jobs=1)]: Done 49 tasks | elapsed: 1.0min[Parallel(n_jobs=1)]: Done 144 out of 144 | elapsed: 3.1min finisheddone in 188.100s()Best score: 0.848 clf__alpha: 1e-05 clf__n_iter: 50 tfidf__use_idf: True vect__max_df: 0.5 vect__max_features: None
svm结果如下:*************************Feature Extraction*************************['clf', 'clf__C', 'clf__cache_size', 'clf__class_weight', 'clf__coef0', 'clf__decision_function_shape', 'clf__degree', 'clf__gamma', 'clf__kernel', 'clf__max_iter', 'clf__probability', 'clf__random_state', 'clf__shrinking', 'clf__tol', 'clf__verbose', 'steps', 'tfidf', 'tfidf__norm', 'tfidf__smooth_idf', 'tfidf__sublinear_tf', 'tfidf__use_idf', 'vect', 'vect__analyzer', 'vect__binary', 'vect__decode_error', 'vect__dtype', 'vect__encoding', 'vect__input', 'vect__lowercase', 'vect__max_df', 'vect__max_features', 'vect__min_df', 'vect__ngram_range', 'vect__preprocessor', 'vect__stop_words', 'vect__strip_accents', 'vect__token_pattern', 'vect__tokenizer', 'vect__vocabulary']Fitting 3 folds for each of 9 candidates, totalling 27 fits[Parallel(n_jobs=1)]: Done 27 out of 27 | elapsed: 9.6min finishedThe best parameters are {'clf__gamma': 1, 'clf__C': 10} with a score of 0.85
0 0
- python使用grid-search调参
- python sklearn包——grid search笔记
- python sklearn包——grid search笔记
- Grid Search简介
- 使用python-selenium grid进行分布式测试
- Grid search in the tidyverse
- python tkinter grid 拉伸
- Python下使用 Region Proposal Method: Selective Search
- Grid的使用实例
- ExtJs grid使用详细
- 使用报表grid++report
- grid+report简单使用
- SourceGrid.Grid使用
- grid.常规使用
- Extjs4 Grid 使用总结
- Extjs---grid的使用
- 如何使用Selenium-Grid
- Grid控件使用示例
- android控件
- 自定义ImageView实现类似微信朋友圈发图片点击出来阴影效果;同时使用Picasso加载网络图片
- MySQL数据库
- 故障案例--通过create server创建federate引擎导致主从失败
- node.js 任务4 用express 自定义路由,接收增删改查请求
- python使用grid-search调参
- spark与Hadoop的比较
- 如何学习MySQL
- EditText 的简单使用
- TabLayout体验
- java中将字符串转换为URL能解析的编码
- 中文字符串截取 mb_substr
- hdu1276士兵队列训练问题(简单队列)
- 真的理解面向对象思维