斯坦福机器学习在线课程笔记

来源:互联网 发布:json嵌套json数据 编辑:程序博客网 时间:2024/05/01 21:21


(http://siliangdu.tk/2011/11/106)


10 Debugging a learning algorithm:

1 获取更多训练集:修正过度拟合

2 使用更少的特征:修正过度拟合

3 使用更多的特征:修正bias(与过度拟合相对,应该是指拟合不足)

4 使用多项式特征(x1^2, x1*x2...):修正bias

5 减小惩罚因子lambda:修正bias

6 增大惩罚因子:修正过度拟合

11 Trading off precision and recall:

precision: 预测为正(即数字1)的样例中,有多少样例实际上确实是正的,true positive / (true positive + false positive)。

recall: 在确实是正的样例中,有多少是正确预测为正的,true positive / (true positive + false negtive)

增大判断的阈值(即h(x) >=0.7预测为正,h(x)<0.7预测为0,0.7为阈值),则增大precision,减小recall;相反,减小判断的阈值,则减小recall,增大precision。

12 SVM

增大C:修正bias

减小C:修正过度拟合

使用Gaussian Kernel时:

增大σ:图形坡度变缓,修正过度拟合

减小σ:图形坡度变陡,修正bias

13 离群点检测

个人认为,离群点检测与某些特定的分类(两类)有些相似,但又有很多区别,主要体现在:

1)离群点检测的训练集、交叉验证集和测试集都极不平衡,甚至只是单类的;而分类的训练集应该是比较均衡的

2)交叉验证时,classification accuracy对离群点检测不适用,原因也是因为数据集的不平衡

3)离群点可以有好多种,也就是说,无法确定离群点的具体类别,只能确定某点不是主流的点而已;而分类可以确定每个点的具体类别

常用基于密度的检测方法,利用高斯分布公式,当一个点x的概率p(x) < ε时,此点被标记为离群点。

假设点x有n个特征:x(1) x(2) ... x(n),则p(x) = p(x(1)) * p(x(2)) * ... p(x(n))

步骤:1)选择对离群点有代表性的特征x(i)  2)计算相应的特征均值和方差  3)计算p(x)


原创粉丝点击
热门问题 老师的惩罚 人脸识别 我在镇武司摸鱼那些年 重生之率土为王 我在大康的咸鱼生活 盘龙之生命进化 天生仙种 凡人之先天五行 春回大明朝 姑娘不必设防,我是瞎子 小孩子读一年级拼音读不好要怎么办 4个月的婴儿恶心干呕怎么办 生了小孩后胆汁酸偏高怎么办 9个月宝宝吃盐了怎么办 两个月宝宝母乳拉大便太稀怎么办呀 两个月的宝宝不拉大便怎么办 两个月宝宝五天没拉大便怎么办 4个月宝宝不拉大便怎么办 2个月宝宝3天没拉大便怎么办 宝宝拉不出大便老是憋的哭怎么办 九个月的宝宝不爱吃水果怎么办 顺产侧切伤口发炎化脓有臭味怎么办 一岁宝宝感冒发烧39度怎么办 宝宝二岁半了只吃水果不吃饭怎么办 8个月小孩发烧39度怎么办 咳嗽吃了很多药都不见效果怎么办 生完孩子半个月奶水越来越少怎么办 买到了坏了的水果商家不赔怎么办 小孩奶不够吃又不吃奶粉怎么办 10个月的宝宝便秘很严重怎么办 四岁的宝宝突然不怎么吃饭怎么办 1岁7个月宝宝突然不爱吃饭怎么办 宝宝发烧好了之后不吃辅食怎么办 吃母乳的宝宝不喝奶粉怎么办 奶水不足宝宝又不喝奶粉怎么办 6个月宝宝断奶哭闹不用奶瓶怎么办 小孩不爱吃饭怎么办该吃些什么 二个月宝宝只认母乳不喝牛奶怎么办 满月宝宝只认奶粉不认母乳怎么办 宝宝四个月只认奶瓶不认母乳怎么办 新生儿只认奶瓶不认母乳怎么办 7个月宝宝不吃辅食怎么办 8个月小孩不吃辅食怎么办 9个月小孩不吃辅食怎么办 十一个月宝宝拉肚子拉水怎么办 小孩好动上课也坐不住会怎么办 幼儿大班关于环保的手抄报怎么办 捷达车打开丝位子风扇总转怎么办 小班个案分析:好动的孩子该怎么办 孩子突然过于的兴奋不睡觉是怎么办 刚出生的宝宝听力未通过怎么办