机器学习之ROC测试指标和测试集价值
来源:互联网 发布:hive 配置mysql 编辑:程序博客网 时间:2024/05/16 04:52
import pandas as pdimport numpy as npfrom sklearn.linear_model import LogisticRegressionnp.random.seed(8)admissions = pd.read_csv("D:\\test\machineLearning\\admissions.csv")admissions["actual_label"]=admissions["admit"]admissions = admissions.drop("admit",axis=1) #删除这一列admissions.head(2)
#洗牌操作,避免被顺序影响np.random.seed(8)shuffled_index=np.random.permutation(admissions.index)shuffled_admissions=admissions.loc[shuffled_index] #loc是根据index来获取数据,iloc是根据行号来获取数据train = shuffled_admissions.iloc[0:515]#取前512用于训练test = shuffled_admissions.iloc[515:len(shuffled_admissions)] #取后面的用于测试from sklearn.linear_model import LogisticRegressionlog = LogisticRegression()log.fit(train[["gpa"]], train["actual_label"])pre_label=log.predict(test[["gpa"]])test["predict_label"]=pre_labelmatch = (test["predict_label"] == test["actual_label"])correct_predict=test[match]accuracy=len(correct_predict)/float(len(test))print accuracy
0.635658914729C:\Users\qiujiahao\Anaconda2\lib\site-packages\ipykernel\__main__.py:13: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame.Try using .loc[row_indexer,col_indexer] = value insteadSee the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
import matplotlib.pyplot as pltfrom sklearn import metrics#ROC图是正力与负力的关系图probalities = log.predict_proba(test[["gpa"]]) #准确概率fpr,tpr,thresholds = metrics.roc_curve(test["actual_label"],probalities[:,1])#绘制ROC图plt.plot(fpr,tpr)plt.show()
from sklearn.metrics import roc_auc_scoreauc_score = roc_auc_score(test["actual_label"],probalities[:,1]) #求处上图的soc的有效面积是多少,我门希望负力接近1,也希望正力也接近1,所以面积越靠近1越好,依次来衡量当前模型的效果print auc_score
0.577932098765
0 0
- 机器学习之ROC测试指标和测试集价值
- 人脸识别---开集测试评价指标ROC曲线
- 机器学习性能评估指标 ROC
- 机器学习之分类性能度量指标 : ROC曲线、AUC值、正确率、召回率
- 测试要求和指标
- 性能测试指标之数据库指标
- (机器学习算法常用指标)准确率,召回率,F1 值、ROC,AUC、mse,mape评价指标
- 机器学习之评估指标
- 机器学习之评价指标
- 机器学习中的训练集、验证集和测试集
- 机器学习中训练集和测试集归一化-matlab
- [机器学习]划分训练集和测试集的方法
- 《软件测试价值提升之路》学习之—测试工程师能力模型
- 机器学习性能评估指标(精确率、召回率、ROC、AUC)
- 机器学习测试题
- 性能测试实施(3)之指标及指标值确认
- 性能测试衡量指标--学习笔记
- 性能测试指标之CPU时间片
- Hadoop 安装Snappy
- oracle初接触
- 利用第三方后期处理材质(PostProcess Material)对物体进行描边【UE4】【C++】
- python 与 c/c++混合编程
- BZOJ 2982 combination
- 机器学习之ROC测试指标和测试集价值
- Android AOP 总结
- 纯css实现进度条效果
- 迭代器(iterator)
- myisam和innodb的qubie
- bzoj1036 树链剖分模板
- Getsavefilename()样例代码片段
- 更新Android Studio版本出现Could not find com.android.tools.build:gradle:2.2.3
- A+B and C (64bit) (20)