Weka Explorer(探索者界面) 详解(4)logistic回归和回归算法
来源:互联网 发布:守序邪恶知乎 编辑:程序博客网 时间:2024/05/16 17:35
大家好,我又回来了。今天讲一讲回归。
回归算法通常用于数值的预测,但是也能用来分类(通过回归计算属于各分类的概率,取其最大者),所以 weka 把回归算法归并于 分类器标签。
打开 weka 在data文件夹下找到 cpu.with.vendor.arff 文件,这就是我们用来测试的样本,加载该样本。
线性回归算法
切换到分类器标签,在 choose 下拉框中选择 function节点下的 LinearRegression 算法,该算法就是最基本的回归算法——线性回归。
点击 Start 按钮,在 Result List 中找到生成的 分类器。右键该分类器 选择 Visualize classifier errors 可以查看分类器的误差。如图:
可以通过选择X轴和Y轴的属性,来从不同维度浏览数据,数据点用大叉表示,大叉越大说明误差越大。
线性回归算法通过计算平方误差来判断生成的分类器与真实数据的匹配程度。
logistic回归算法
当我们把线性回归算法用于分类的时候,线性回归算法就会有一个很大的弊端:
举例来说 某样本有两个分类A 和 B。
当用线性回归算法计算某个实例是属于A 还是属于B的时候,可以得到实例分属 A 和 B 的概率值,往往得到概率值都不在0到1之间。进一步说,假设分类器预测出实例属于A类的概率是1.88,属于B类的概率是3.27,该实例实际是属于B类的,试问该分类器的误差又该如何计算?不能计算误差又谈何回归?
logistic回归的出现正是用来解决上述问题的。
它的设计思想是这样的。概率值得范围在[0,1]之间,而线性回归的返回值的范围则是负无穷到正无穷之间。找一个函数能把线性回归函数的值域映射到概率值的域。负无穷对应概率值0,正无穷对应概率值1。于是就有了logistic回归:
P(x)=1/(1+exp(-f(x1,x2,x3.....xk))
其中f(x1,x2,x3.....xk)是一个线性回归函数。
在logistic回归里计算误差的模型是 对数似然。
M5P回归算法
在这里再向大家介绍一种很实用的回归算法:M5P算法。这个算法是决策树和线性回归算法的一个结合体。
举一个例子向大家说明。
预测 处理器芯片的价格。 处理器芯片分为电脑使用的通用芯片(代表是Intel 和 AMD)和手机、嵌入式设备使用的芯片(ARM芯片)。即使两种芯片的其他参数大体一致,通用芯片和嵌入式芯片的价格还是会有很大不同。如果在生成回归模型的时候把这两类芯片的数据混为一谈,那么生成出来的线性模型的误差必定会变得很大。如果能用决策树算法把样本预先分成两类(通用和嵌入式),然后对两个分类分别进行回归算法,那么回归模型就会好很多。
在 weka 中的分类器算法下拉框中,找到 trees 节点下的 M5P算法,对 cpu.with.vendor.arff 样本进行回归,然后与 LinearRegression 算法 比较误差,可以发现 M5P算法明显更好。如下图(图中根据MMAX这个参数先把样本分成了两类):
- Weka Explorer(探索者界面) 详解(4)logistic回归和回归算法
- Weka Explorer(探索者界面) 详解(1)
- Weka Explorer(探索者界面) 详解(2)
- Weka Explorer(探索者界面) 详解(3)决策树算法,分类器评价标准说明
- 逻辑回归算法--Logistic回归
- 线性回归和logistic回归
- logistic回归和logic回归
- logistic回归和softmax回归
- Java集成Weka做逻辑回归(Logistic Regression)
- 线性回归,logistic回归和一般回归
- 线性回归,logistic回归和一般回归
- 线性回归,logistic回归和一般回归
- 线性回归,logistic回归和一般回归
- Logistic回归算法
- 分类算法:Logistic回归
- Logistic回归算法实现
- Logistic回归算法
- Logistic回归原理详解
- 自定义session信息写入文件
- 关于搜索引擎及其开发
- 如果获取当前grid中的所有数据
- MongoDB 安装与下载
- jpbm回退,会签,自由流,撤销
- Weka Explorer(探索者界面) 详解(4)logistic回归和回归算法
- Ubuntu下安装Android反编译工具apktool和应用数字签名
- Handler 在线程中处理进度条
- 用cmd命令修改文件属性,让用户没有权限操作或隐藏文件
- 不用+-实现两个数相加
- 优化 SQL Server CPU 性能
- C中restrict关键字
- 如何使Android应用程序获得root权限
- hadoop 命令总结