【读书笔记】机器学习实战 第7章 7.7节非均衡分类问题
来源:互联网 发布:苏州软件项目经理招聘 编辑:程序博客网 时间:2024/05/17 02:52
机器学习实战
7.7节 非均衡分类问题
- 分类性能指标:
错误率 指错分样本的比例,这样的度量掩盖了样例是如何被错分的事实。有一个普遍适用的称为混淆矩阵
-
-
分类中,当某个类别的重要性高于其他类别时,可以利用混淆矩阵定义出比错误率更好的指标:
查准率/正确率
P=TPTP+FP 查全率/召回率
R=TPTP+FN P-R曲线/查准率-查全率曲线
- 真正确率/真阳率 TPR
TPR=TPTP+FN - 假正确率/假阳率 FPR
FPR=FPTN+FP - ROC曲线
机器学习实战 7.7 节
# ROC曲线绘制def plotROC(predStrengths, classLabels):# 预测强度向量,样本标签 import matplotlib.pyplot as plt # 导入库 cur = (1.0,1.0) #cursor ySum = 0.0 #variable to calculate AUC numPosClas = sum(array(classLabels)==1.0) yStep = 1/float(numPosClas); xStep = 1/float(len(classLabels)-numPosClas) sortedIndicies = predStrengths.argsort()#get sorted index, it's reverse fig = plt.figure() fig.clf() ax = plt.subplot(111) #loop through all the values, drawing a line segment at each point for index in sortedIndicies.tolist()[0]: if classLabels[index] == 1.0: delX = 0; delY = yStep; else: delX = xStep; delY = 0; ySum += cur[1] #draw line from cur to (cur[0]-delX,cur[1]-delY) ax.plot([cur[0],cur[0]-delX],[cur[1],cur[1]-delY], c='b') cur = (cur[0]-delX,cur[1]-delY) ax.plot([0,1],[0,1],'b--') plt.xlabel('False positive rate'); plt.ylabel('True positive rate') plt.title('ROC curve for AdaBoost horse colic detection system') ax.axis([0,1,0,1]) plt.show() print "the Area Under the Curve is: ",ySum*xStep
阅读全文
0 0
- 【读书笔记】机器学习实战 第7章 7.7节非均衡分类问题
- 机器学习实战笔记之非均衡分类问题
- 机器学习实战——第七章:处理非均衡分类问题
- 机器学习 非均衡分类问题
- 机器学习中的非均衡分类问题
- 机器学习实战4:Adaboost提升:病马实例+非均衡分类问题
- 读书笔记:机器学习实战【第7章:利用Adaboost元算法提高分类性能】
- 机器学习实战---读书笔记: 第4章 基于概率论的分类而方法:朴素贝叶斯
- 机器学习实战读书笔记-kNN分类算法
- 【读书笔记】机器学习实战 第7章 7.6节 在难数据集上应用AdaBoost
- 机器学习实战---读书笔记: 第2章 k-近邻算法
- 机器学习实战---读书笔记: 第3章 决策树
- 机器学习实战---读书笔记: 第5章 基Logistic回归
- 读书笔记:机器学习实战【第3章 决策树】
- 读书笔记:机器学习实战【第4章:朴素贝叶斯】
- 读书笔记:机器学习实战【第5章:Logistic回归】
- 非均衡分类问题
- 非均衡分类问题
- 多态
- 设置vim的默认模板文件
- celery常用配置总结 【celery配置worker数和单个worker最多执行任务数】
- 通达OA MQ和Redis服务无法启动问题的处理(图文)
- 编程十诫
- 【读书笔记】机器学习实战 第7章 7.7节非均衡分类问题
- python调用MonkeyRunnerAPI编写app录制脚本
- 西安达刚公路机电科技有限公司董事长李太杰简介
- 基于php的记录网页访问量的小代码
- 图像的峰值信噪比(PSNR)的计算方法
- 插入排序
- Java里有无goto
- 递归最大元素
- C++虚函数