Stanford机器学习---第十讲. 数据降维
来源:互联网 发布:一只绣花鞋 知乎 编辑:程序博客网 时间:2024/05/18 02:52
第十讲. 降维——Dimensionality Reduction
===============================
(一)、为什么要降维?
(二)、主成分分析Principal Component Analysis (PCA)
(三)、PCA 算法流程
(四)、从压缩数据中恢复原数据
(五)、怎样决定降维个数/主成分个数
(六)、应用PCA进行降维的建议
本章主要讲述应用PCA算法进行数据降维的原理
=====================================
(一)、为什么要降维?
- About data:
- About Visualization:
=====================================
(二)、About Principal Component Analysis (PCA)
- PCA 目的:降维——find a low dimension surface on which to project data ~
- PCA 与 Linear Regression 的区别:
=====================================
(三)、PCA 算法流程
μj = Σm Xj(i)/m
=====================================
(四)、从压缩数据中恢复原数据
=====================================
(五)、怎样决定降维个数/主成分个数
所以,可以用下式进行k的合理选取:
=====================================
(六)、应用PCA进行降维的建议
Ans:NO!应用PCA提取主成分可能会解决一些overfitting的问题,但是呢,不建议用这种方法解决overfitting问题,还是建议用第三章中讲过的加入regularization项(也称为ridge regression)来解决。
2. PCA中主成分分析应用到那部分数据呢?
Ans:Only Training Data!可以用Cross-Validation data 和 test Data进行检验,但是选择主分量的时候只应用training data.
3. 不要盲目PCA
Notice:only 当你在原数据上跑到了一个比较好的结果,又嫌它太慢的时候才采取PCA进行降维,不然降了半天白降了~
原文地址:http://blog.csdn.net/abcjennifer/article/details/8002329
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十二讲. 数据降维
- Stanford机器学习---第10讲. 数据降维
- Stanford Machine Learning -- 第十讲 大规模学习
- Stanford机器学习---第十三讲. 异常检测---此讲综合应用了所有以往知识
- Stanford机器学习---第九讲. 聚类
- Stanford机器学习---第十四讲. 推荐系统
- Stanford机器学习---第十六讲. PHOTO ORC
- Stanford机器学习---第九讲. 聚类
- 视频流传输协议RTP/RTCP/RTSP/HTTP的区别
- 为什么需要序列化
- 七牛用户怎样将视频转码成普清高清来适应不同的手机端或者web端
- CentOS7.0 安装JAVA环境
- QT中安装配置QWT环境
- Stanford机器学习---第十讲. 数据降维
- final关键字的用法
- 系统性能工具osw
- cmd编译出现 java.lang.NoClassDefFoundError的解决方法
- 重构的原则
- easyui treegrid根据条件定义行样式
- scala implicit class
- maven手动添加jar包到本地仓库
- C++ 虚构造函数和虚析构函数