PCA降维
来源:互联网 发布:windows密钥 编辑:程序博客网 时间:2024/06/01 08:40
1. PCA降维
1.1 概念
主成分分析( PrincipalComponent Analysis, PCA)或者主元分析。是一种掌握事物主要矛盾的统计分析方法,它可以从多元事物中解析出主要影响因素,揭示事物的本质,简化复杂的问题。PCA类训练一个模型,用PCA将向量投射到一个低维度空间
1.2 用处
数据降维,将复杂的维度简单化,减少运算量
1.3 细节
Vectorsize 维度不能超过65535。因为PCA源码中需要计算协方差,需要开辟一个n*n的int长度的数组。
1.4 Demo
package spark.mllibimport org.apache.spark.{SparkConf, SparkContext}import org.apache.spark.sql.SparkSession/** * Created by liuwei on 2017/7/13. */object PCATest { def main(args: Array[String]): Unit = { import org.apache.spark.ml.feature.PCA import org.apache.spark.ml.linalg.Vectors var arr1:Array[Double] = new Array[Double](5000) for(i <- 0 to arr1.length-1){ arr1(i) = i%10 }// arr1.foreach(println) val v1 =Vectors.dense(arr1);// val v1 =arr1.toVector// val v2 =arr1.toVector// v3.a val data = Array( Vectors.sparse(5000, Seq((1, 1.0), (3, 7.0))), v1, v1 ) val sparkConf = new SparkConf().setAppName("PCATest").setMaster("local[8]") val sc = new SparkContext(sparkConf) val spark = SparkSession.builder.getOrCreate() val df = spark.createDataFrame(data.map(Tuple1.apply)).toDF("features") val pca = new PCA() .setInputCol("features") .setOutputCol("pcaFeatures") .setK(5) .fit(df) val result = pca.transform(df).select("pcaFeatures") result.show(false) }}
阅读全文
1 0
- PCA降维
- 降维:PCA
- PCA降维
- PCA降维
- PCA降维
- PCA降维
- PCA降维
- PCA降维
- PCA降维
- PCA降维
- 降维- PCA
- PCA降维
- PCA openCA 中使用 PCA 降维
- OpenCV下PCA降维
- PCA降维(转)
- Matlab使用PCA降维
- [算法5]PCA降维
- 关于pca降维_princomp
- PHP语法基础(与Java、C++等作比较)
- hadoop1和hadoop2的比较
- SpringMVC上传文件配置
- matlab 基础应用之二元插值
- Java中的反射机制(Reflect)
- PCA降维
- POJ-1723 中位数
- Python3之for循环、元组、字典
- Android Studio中Grpc的配置
- 【内功篇】指针&数组&字符串(四)
- ubuntu系统下codeblocks编译时提示/bin/sh: 1: g++: not found
- RecyclerView+SnapHelper实现无限循环筛选控件
- Hadoop数据完整性
- 第七届福建省赛 FZU 2267 The Bigger the Better(贪心 后缀数组)