机器学习 笔记(一)Non-linear classification

来源:互联网 发布:最新翻墙软件 编辑:程序博客网 时间:2024/05/29 19:33

刚刚学了Andrew Ng在Coursera上的Machine Learning公开课,感觉在学习的过程中,有一些疑惑,尤其是各种算法之间的联系,以及在模型训练中遇到的普遍性的注意点,这里做一个回顾和总结。

非线性分类问题( Non-linear classification)

可以用逻辑回归算法Logistic regression algorithm来解决这个问题。
对于数据集(X,Y),可视化如下图:
这里写图片描述

直接用罗辑回归算法只能找到线性分界线,做线性分类,如下:
 图2 用罗这里写图片描述
那么,针对这种非线性的分类该如何做呢?
1. Feature mapping,创造更多的特征,如从2维变成28维(变成非线性的特征了)
这里写图片描述

2.获得costfunction
3. 获得gradient
4. 用fminunc学习参数theta
5. 调整正则参数 lambda (正则项用于防止过拟合overfitting),尝试多个lambda值,以0和0.01开始,以2的倍数增加。

0 0