【数据挖掘 xgboost】特征的重要程度分析
来源:互联网 发布:防网络诈骗图片 编辑:程序博客网 时间:2024/06/05 08:17
代码片段
import pandas as pdimport xgboost as xgbimport operator# # 从sklearn.cross_validation里选择导入train_test_split用于数据分割。# from sklearn.model_selection import train_test_split# # 从使用train_test_split,利用随机种子random_state采样25%的数据作为测试集。# X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=33)## # 从sklearn.preprocessing里选择导入数据标准化模块。# from sklearn.preprocessing import StandardScaler# # 对训练和测试的特征数据进行标准化。# ss = StandardScaler()# X_train = ss.fit_transform(X_train)# X_test = ss.transform(X_test)#这里的参数自己改xgb_params = {'booster':'gbtree','objective': 'binary:logistic', "eta": 0.01, "max_depth": 5, "silent": 0,"colsample_bytree":0.7}num_rounds = 1000dtrain = xgb.DMatrix(X_train, label=y_train)gbdt = xgb.train(xgb_params, dtrain, num_rounds)importance = gbdt.get_fscore()importance = sorted(importance.items(), key=operator.itemgetter(1))print importance
阅读全文
1 0
- 【数据挖掘 xgboost】特征的重要程度分析
- 微博特征与行为的大数据挖掘分析
- xgboost 保存模型和特征重要度
- 数据挖掘(pandas&xgboost)
- 数据特征分析---Python数据挖掘与分析
- matlab数据挖掘学习篇----数据特征分析
- 数据挖掘模型的两种特征
- 数据挖掘里面的特征工程
- 数据挖掘中的利器--XGBoost理论篇
- 【数据挖掘知识点一】数据分布特征的描述
- MATLAB数据分析与挖掘实战-数据探索-3.2 数据特征分析
- Android 进程的重要程度等级划分
- 选择数据挖掘技术的两个重要依据
- 重要的数据挖掘和机器学习算法
- 数据挖掘的十八般武艺,咳咳,十八个重要算法
- 数据挖掘--分类--决策树--特征
- 数据挖掘之特征选择
- 数据挖掘之特征选择
- 随便输入两个数求出这个数到另一个数之间的和
- linux 查询命令
- python中os.path以及sys.path模块简介
- java 操作数字证书(x509)
- springmvc中controller 使用@RestController 和 @Controller 返回结果的区别
- 【数据挖掘 xgboost】特征的重要程度分析
- Maven使用中相关的问题
- leetCode#198. House Robber
- JVM之类文件结构
- IntelliJ IDEA添加jar包
- 我为什么使用maven
- GitHub最著名的20个Python机器学习项目!
- 【阿里在线技术峰会】何登成:AliSQL性能优化与功能突破的演进之路
- JSONDecodeError: Expecting value: line 1 column 1 (char 0)