斯坦福机器学习——异常检测

来源:互联网 发布:华能和国电投合并知乎 编辑:程序博客网 时间:2024/05/22 08:41

一、模型评价方法总结

当数据有倾斜时,如A类比例为95%远远大于B类比例5%,不应该用分类的正确率来评价模型好坏。因为如果你直接瞎蒙都有95%的大概率蒙对,那么你的模型正确率即使比95%大一点,也没有说服力。这样,新的评价指标:召回率、精准率、最终的F1值作为评价指标。可以参考点击打开链接

二、异常检测算法

原理:通过正常数据,拟合出特征向量X的概率分布,可以假设特征向量中给个字段相互独立来计算联合的高斯概率密度函数,或者计算多元高斯模型的概率密度函数;最后通过计算待测样本在概率模型中的概率值来判断是否异样。可以参考点击打开链接
0 0
原创粉丝点击