XGBoost入门
来源:互联网 发布:2017黑页源码带音乐 编辑:程序博客网 时间:2024/05/21 10:42
CNN和RNN更多的是用来处理图像识别和语音识别,日常工作中我们可能更多的是基于结构化数据来解决分类或回归问题。下面用XGBoost来开发一个简单的二分类问题。
数据集用来判断患者是否会在5年内患糖尿病,有9列数据, 前8列是变量数据,最后一列是标签数据。
数据集地址
https://archive.ics.uci.edu/ml/machine-learning-databases/pima-indians-diabetes/pima-indians-diabetes.data
from numpy import loadtxtfrom xgboost import XGBClassifierfrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import accuracy_score#分出变量和标签dataset = loadtxt('pima-indians-diabetes.data', delimiter=",")X = dataset[:,0:8] #前8列为数据Y = dataset[:,8] #最后一列是标签数据#将数据分为训练集和测试集,训练集用来训练模型,测试集用来预测seed = 7test_size = 0.33X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=test_size, random_state=seed)#训练模型model = XGBClassifier()model.fit(X_train, y_train)#评估模型y_pred = model.predict(X_test)predictions = [round(value) for value in y_pred] #xgboost 的结果是每个样本属于第一类的概率,需要用 round 将其转换为 0 1 值#准确率accuracy = accuracy_score(y_test, predictions)print("Accuracy: %.2f%%" % (accuracy * 100.0))
参考资料
http://geek.csdn.net/news/detail/201207
阅读全文
0 0
- XGBoost入门
- xgboost入门
- xgboost快速入门
- kaggle 入门 rossmann xgboost
- Kaggle入门 (Titanic XGBoost)
- XGBoost 入门使用方法
- XGBoost快速入门
- xgboost使用入门
- xgboost入门(原理)
- xgboost零基础入门
- xgboost
- xgboost
- xgboost
- xgboost
- xgboost
- xgboost
- xgboost
- XGBoost
- RedHat 7 找回root密码和grub2加密
- 使用 GNU autotools 改造一个软件项目
- jquery.flot.js 之 柱状图
- sleep与usleep备忘
- 这么多种列类型,你都用对了吗?
- XGBoost入门
- SpringMVC UEditor
- jquery实现节点上移、下移
- Python基础(5)-函数
- Keil MDK 5代码补全功能设置
- PAT--L2-004. 这是二叉搜索树吗?
- TagFlowLayout(新手搬运完整版) 简单的多选tag布局
- 来聊聊WWDC 苹果大会上的那些黑科技
- collect2 ../