Google机器学习教程心得(三) 好的feature
来源:互联网 发布:租房还是买房划算知乎 编辑:程序博客网 时间:2024/04/29 13:23
什么造就好的Feature
Google Machine Learning Recipes 3
官方中文博客 http://chinagdg.org/2016/03/machine-learning-recipes-for-new-developers/
视频地址 http://v.youku.com/v_show/id_XMTU1MDU5OTY2OA==.html?f=26979872&from=y1.2-3.4.4
Github工程地址 https://github.com/ahangchen/GoogleML
欢迎Star,也欢迎到Issue区讨论
Feature越好,分类器也就越好
这里举了一个对两种狗狗做分类的问题介绍好的Feature应有的特性
简化问题
好的feature能有力地说明两个类别的不同
单个feature往往不完美,所以需要多个feature
- 假如由人来做分类器,会需要什么信息?(找好的feature)
- 对于一个feature,如果不同的label中,这个feature的值分布越均匀,则这个feature的分类作用越弱
在同一种眼睛颜色中,不同狗的数量差不多,说明眼的颜色的分类作用弱,这样的feature会降低分类器的准确性
- 好的feature应该是相互独立的,能够提供更多有效信息,
- 每个feature在分类器中都占一定的重要性,而如果feature间不独立,重要性的比重也会与原本的计划有偏差
- feature应当预处理地尽可能与结果直接相关
- 有好的feature还不够,还要有好的feature之间的好的组合
总结
好的feature应该是这样的:
- Informative
- Independent
- Simple
代码
Good-Feature:构造数据集与绘制柱状图
如果觉得我的文章对您有帮助,请随意打赏~
1 0
- Google机器学习教程心得(三) 好的feature
- Google机器学习教程心得(一)
- Google机器学习教程心得(二)决策树与可视化
- 绝对经典 、好的机器学习教程
- 机器学习的特征选择(feature selection)
- 机器学习(一)- feature scaling
- 对“视觉机器学习20讲配套仿真代码”的研究心得---Adaboost(三)
- 《机器学习》阅读心得---三、线性模型
- STM32F103mini教程学习总结与心得(三)---->中断
- STM32F103mini教程学习总结与心得(三)---->中断
- Feature开发三(Feature文件元素的解释--SDK)
- Android学习笔记(Google官方教程)(三)
- Python教程:进击机器学习(三)--Numpy
- 好的机器学习网站
- 机器学习好的论坛
- 机器学习好的网站
- 如何学习机器学习的一点心得
- 如何学习机器学习的一点心得
- 贪心算法☞最优服务次序&多处服务最优次序
- hdu 2328 字符串处理Corporate Identity
- MySQL/Oracle数据库基础
- Java中的自动装箱与拆箱
- 自定义ViewPager指示器
- Google机器学习教程心得(三) 好的feature
- Unix网络编程之常见的数据结构
- Mac Octave 作图报错
- 在eclipse操作hbase时,遇到的问题
- Spark组件之GraphX学习6--随机图生成和出度入度等信息显示
- 研究MapReduce源码之实现自定义LineRecordReader完成多行读取文件内容
- Learning Spark (Python版) 学习笔记(二)----键值对、数据读取与保存、共享特性
- 顺时针打印矩形列表
- 【黑马Android】(08)activity生命周期/横竖屏切换的生命周期/任务栈的概念/广播接收者ip拨号器/进程的优先级&为什么使用服务