机器学习4:分类classification
来源:互联网 发布:网站手机号码抓取软件 编辑:程序博客网 时间:2024/06/06 04:19
深度学习笔记四
本节课讲的内容是分类Classification.
上一节讲的regression主要解决的是输入一串数字,输出一串数字(譬如对股票价格的预测)。跟regression不同的是,classification主要用于针对输入的多维数据,输出一个判断(譬如输入一个图片,判断是什么动物)
有的人尝试使用 regression的方法来做,并且设定假如输出为1,判断为一个类型,输出为-1,判断为另一个类型。
这样有可能会得到好的结果,有可能会得到坏的结果
本图上左边结果是好的,分界线刚好能区分开,但是大多数情况是右图,一旦有一些偏离的很远的data,就会对分界线造成很大的扰动。在Bishop的书上将这种情况描述为:"Penalize to the examples that are too correct"所以其实regression的定义不是很适用于classification的。
理想的模型应该是:
即在f(x)内再内建一个函数g(x),当g(x)>0时,是class1;其余情况,是class2
损耗函数表达的意思是尽量使判断出来的类别和真实的类别不一样的次数最小。
我们首先从概率的角度来求解:
P(c1|x)表示x是属于C1的
P(x|c1)表示C1中取样得到x的概率
P(c1)表示在C1中取样的概率
现在我们需要通过样本来估测得到P(x|c1).
我们假设P(x|c1)服从高斯分布,即:
我们需要找到最准确的高斯方程来代表P(x|c1)
最准确的高斯分布,用其高斯分布算出来的概率应该是最高的
所以我们定义一个loss函数L,L等于C1内所有training set的计算结果的乘积
将其求导取极值,算出L等于极值时的参数µ和Е
现在我们就得到了在C1内概率,同理求得在C2内的概率。
这样我们就可以用这两个概率函数来进行分类了。
分类的规则是:将数据分类为概率最高的那一类。
但是结果并不好。
仅仅有50%左右的概率分类对。
为了增加正确率,我们更改模型,让不同类的高斯分布函数共用Е
这样的结果会让边界变成线性的
我们会发现,这样的结果比之前好很多
- 机器学习4:分类classification
- [机器学习]逻辑回归,Logistic regression |分类,Classification
- 机器学习笔记04:逻辑回归(Logistic regression)、分类(Classification)
- 机器学习中的回归(regression)与分类(classification)问题
- Tensorflow Classification 分类学习
- Tensorflow学习--Classification 分类
- 机器学习基石-08-4-Weighted Classification
- 【机器学习】分类算法之朴素贝叶斯分类(Naive Bayesian classification)
- 机器学习入门 之 《集体智慧编程》 贝叶斯分类(bayesian classification)
- 机器学习算法笔记1_2:分类和逻辑回归(Classification and Logistic regression)
- 林轩田机器学习基石——多类别分类问题(multi-class classification)
- 机器学习入门系列05,Classification: Probabilistic Generative Model(分类:概率生成模型)
- 斯坦福机器学习实验之3-多分类和神经网络(Multi-class Classification and Neural Networks)
- [机器学习入门] 李宏毅机器学习笔记-5(Classification- Probabilistic Generative Model;分类:概率生成模型)
- 机器学习基石-09-4-Linear Regression for Binary Classification
- TensorFlow教程 5.1Classification 分类学习
- [完]机器学习实战 第四章 基于概率论的分类方法:朴素贝叶斯(Naive Bayesian Classification)
- 机器学习2——分类和逻辑回归Classification and logistic regression(牛顿法待研究)
- thinkphp配置文件动态修改
- html4+css2 基本标签2
- 一个灵活设置十六进制颜色值的方法
- 浏览器的内核分别是什么?经常遇到的浏览器的兼容性有哪些?原因,解决方法是什么,常用hack的技巧 ? * IE浏览器的内核Trident、 Mozilla的Gecko、google的WebKi
- 函数指针调用
- 机器学习4:分类classification
- redis远程连接不上
- notepad++添加16进度插件
- java多态笔试题
- Qt之QSS(语法高亮)
- 解决Invalid derived query! No property find found for type XX的问题
- HDU
- 表格一些基本操作
- 一个html元素内有多个html元素,让子元素并排自动换行居中,且有间距