机器学习:特征选择之 Filter :Relief方法
来源:互联网 发布:注册淘宝 编辑:程序博客网 时间:2024/06/06 02:55
Relief特征选择方法是一种filter方法。filter方法的过程如下:
下面结合论文[1]谈下Relief算法。该算法的流程如下图:
其中第一个参数S是训练集,第二个m是S的大小,第三个t为相关判定阈值,0<=t<=1.
1、Relief认为什么样的特征是相关的那,换句话说什么样的特征对类别具有区分性那?
以二分类为例,如果一个特征对区分0/1是有帮助的,那么该特征的分布应该不是随机的。举个不恰当的例子,假设特征f1在类别1中出现频率很大,而在类别0中却很少出现,那么f1对分类是具有贡献的。
回到Relief算法,对实例xi中的某一特征fi而言,xi中的fi应该与Near-hit的fi相近,而与Near-miss中的fi相远。[1]从统计学的角度详细说明了Relief的特征相关性选择依据。
2、Relief的优点与不足
优点:Relief对噪音不敏感,训练速度比穷举搜索Focus[2]特征选择要快。
缺点:Relief不能处理特征冗余,数据稀疏性性对降低算法的性能
最近较忙,简单介绍下,具体参考论文[1]
[1]The Feature Selection Problem:Traditional Methods and a New Algorithm ,Kenji Kira
[2] Science Society.[Almuallim & Dietterich 19911 Almuallim, H. &Dietterich, T. G., Learning With Many Irrelevant Features, Proceedings of the Ninth National
- 机器学习:特征选择之 Filter :Relief方法
- 机器学习&数据挖掘:特征选择之Filter : Focus Approach
- 特征选择之relief及reliefF算法
- 机器学习特征选择方法
- 西瓜书《机器学习》课后答案——chapter11_11.1 Relief特征选择算法
- 机器学习之特征选择
- 机器学习之 特征选择
- 机器学习之特征选择
- 特征选择算法-Relief
- 机器学习 特征工程之特征选择
- 机器学习 特征工程之特征选择
- 机器学习之特征工程-特征选择
- 机器学习之(四)特征工程以及特征选择的工程方法
- 机器学习之(四)特征工程以及特征选择的工程方法
- 机器学习之特征工程以及特征选择的工程方法
- 机器学习:文本挖掘之特征选择
- 机器学习之文本特征选择
- 机器学习:特征工程之特征选择和学习
- Handlebars学习之——块表达式
- 虚拟机字节码执行引擎
- 【BZOJ 1055】【HAOI 2008】玩具取名 【区间DP】
- WEB前端开发书籍
- 2016-11-14 我的第一篇博客
- 机器学习:特征选择之 Filter :Relief方法
- Buy and sell stock at best time(i,ii,iii)
- 第十一周-判断三角形
- 九九归一
- Repeating Decimals,ACM/ICPC World Finals 1990,UVa202
- 在做自动化测试之前你需要知道的,转自:http://www.cnblogs.com/fnng/p/3653793.html
- block 入门
- 计算机网络基本概念
- mac系统:HTTP Status 500 - java.lang.ClassNotFoundException: org.apache.jsp.helloworld_jsp