Stanford机器学习---第十讲. 数据降维
来源:互联网 发布:spring源码 深度解析 编辑:程序博客网 时间:2024/05/05 09:52
PS: 盼望已久的十一长假就要到了~祝大家国庆快乐,玩的开心!(*^__^*)
第十讲. 降维——Dimensionality Reduction
===============================
(一)、为什么要降维?
(二)、主成分分析Principal Component Analysis (PCA)
(三)、PCA 算法流程
(四)、从压缩数据中恢复原数据
(五)、怎样决定降维个数/主成分个数
(六)、应用PCA进行降维的建议
本章主要讲述应用PCA算法进行数据降维的原理
=====================================
(一)、为什么要降维?
- About data:
- About Visualization:
=====================================
(二)、About Principal Component Analysis (PCA)
- PCA 目的:降维——find a low dimension surface on which to project data ~
- PCA 与 Linear Regression 的区别:
=====================================
(三)、PCA 算法流程
μj = Σm Xj(i)/m
value decomposition),在matlab中有函数[U,S,V] = svd(A) 返回一个与A同大小的对角矩阵S(由Σ的特征值组成),两个酉矩阵U和V,且满足= U*S*V'。若A为m×n阵,则U为m×m阵,V为n×n阵。奇异值在S的对角线上,非负且按降序排列。
该矩阵大小为n×k
=====================================
(四)、从压缩数据中恢复原数据
=====================================
(五)、怎样决定降维个数/主成分个数
所以,可以用下式进行k的合理选取:
=====================================
(六)、应用PCA进行降维的建议
Ans:NO!应用PCA提取主成分可能会解决一些overfitting的问题,但是呢,不建议用这种方法解决overfitting问题,还是建议用第三章中讲过的加入regularization项(也称为ridge regression)来解决。
2. PCA中主成分分析应用到那部分数据呢?
Ans:Only Training Data!可以用Cross-Validation data 和 test Data进行检验,但是选择主分量的时候只应用training data.
3. 不要盲目PCA
Notice:only 当你在原数据上跑到了一个比较好的结果,又嫌它太慢的时候才采取PCA进行降维,不然降了半天白降了~
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十二讲. 数据降维
- Stanford机器学习---第10讲. 数据降维
- Stanford Machine Learning -- 第十讲 大规模学习
- Stanford机器学习---第十三讲. 异常检测---此讲综合应用了所有以往知识
- Stanford机器学习---第九讲. 聚类
- Stanford机器学习---第十四讲. 推荐系统
- Stanford机器学习---第十六讲. PHOTO ORC
- Stanford机器学习---第九讲. 聚类
- JDBC中的SQL
- python下函数参数的传递(*和**)
- HttpsPostGet
- 输出日志信息是指Android应用
- spring security3.x学习(16)_JdbcUserDetailManager的使用
- Stanford机器学习---第十讲. 数据降维
- timus 1242. Werewolf【队列+结构体】
- DWZ(JUI) 教程 左侧栏默认是关闭状态的问题
- python的stat模块
- CocoaAsyncSocket学习
- Python 的 cx_Oracle 模块
- LEETCODE: Spiral Matrix II
- DWZ(JUI) 教程 左侧菜单初始化是关闭状态
- 第三届河南省程序设计大赛 - 部分题解