Stanford机器学习---第10讲. 数据降维
来源:互联网 发布:css js 执行环境 编辑:程序博客网 时间:2024/05/18 02:30
本栏目(Machine learning)包括单参数的线性回归、多参数的线性回归、Octave Tutorial、Logistic Regression、Regularization、神经网络、机器学习系统设计、SVM(Support Vector Machines 支持向量机)、聚类、降维、异常检测、大规模机器学习等章节。内容大多来自Standford公开课machine learning中Andrew老师的讲解和其他书籍的借鉴。(https://class.coursera.org/ml/class/index)
第十讲. 降维——Dimensionality Reduction
===============================
(一)、为什么要降维?
(二)、主成分分析Principal Component Analysis (PCA)
(三)、PCA 算法流程
(四)、从压缩数据中恢复原数据
(五)、怎样决定降维个数/主成分个数
(六)、应用PCA进行降维的建议
本章主要讲述应用PCA算法进行数据降维的原理
=====================================
(一)、为什么要降维?
- About data:
- About Visualization:
=====================================
(二)、About Principal Component Analysis (PCA)
- PCA 目的:降维——find a low dimension surface on which to project data ~
- PCA 与 Linear Regression 的区别:
=====================================
(三)、PCA 算法流程
μj = Σm Xj(i)/m
=====================================
(四)、从压缩数据中恢复原数据
=====================================
(五)、怎样决定降维个数/主成分个数
所以,可以用下式进行k的合理选取:
=====================================
(六)、应用PCA进行降维的建议
Ans:NO!应用PCA提取主成分可能会解决一些overfitting的问题,但是呢,不建议用这种方法解决overfitting问题,还是建议用第三章中讲过的加入regularization项(也称为ridge regression)来解决。
2. PCA中主成分分析应用到那部分数据呢?
Ans:Only Training Data!可以用Cross-Validation data 和 test Data进行检验,但是选择主分量的时候只应用training data.
3. 不要盲目PCA
Notice:only 当你在原数据上跑到了一个比较好的结果,又嫌它太慢的时候才采取PCA进行降维,不然降了半天白降了~
转自:CSDN博客Rachel-Zhang和新浪微博Sophia_qing。
Stanford机器学习最新学习网址:
- Stanford机器学习---第10讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十二讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第十讲. 数据降维
- Stanford机器学习---第9讲. 聚类
- Stanford机器学习---第7讲. 机器学习系统设计
- Stanford机器学习---第8讲. 支持向量机SVM
- Stanford机器学习---第6讲. 怎样选择机器学习方法、系统
- Stanford机器学习---第九讲. 聚类
- Stanford机器学习---第十四讲. 推荐系统
- uefi引导装win8.1
- 判断dataGridView是否重复值
- 码农创业记(一)
- 设计模式---工厂方法模式
- Stanford机器学习---第9讲. 聚类
- Stanford机器学习---第10讲. 数据降维
- linux C++静态库 动态库的生成于调用
- osi 七层模型
- Unix/Linux环境C编程入门教程(28) 日期时间那些事儿
- linux下查找文件的方法
- POJ 2472 106 miles to Chicago
- linux下tar.gz、tar、bz2、zip等解压缩、压缩命令小结
- POJ1696-Space Ant
- 字体在Android View中的输出 drawText