OpenCV实现主成分分析(PCA)

来源:互联网 发布:淘宝客推广位怎么设置 编辑:程序博客网 时间:2024/06/06 04:34

这几天将大学期间做的项目,尝试将MATLAB代码转为C++。
这里对主成分做一个备忘。
这里先简单说一下我对主成分的理解,就是将数据降维。一组数据间的各个元素可能存在一定的关联。比如:一组数据[1 2 3],那么3可以由1+2表示,那么就可以用[1 2]来表示[1 2 3]这组数据,这样在实际数据处理时,就可以只用处理2维的数据,不用处理3维数据,可以提高程序效率。详细的原理讲解,网上大神们讲得都很好。我这里就主要说代码。

在实际工程中,PCA处理一般分为两步:1、获取数据均值、特征值、特征向量;2、利用第一步的特征值获取输入参量的主成分。
我这里只要用OpenCV来实现。

环境:WIN10+VS2015+OpenCV3.1.0

第一步:获取特征向量

#include <opencv2/opencv.hpp>#include <fstream>using namespace cv;using namespace std;// data:输入数据// T:主成分百分比;范围0--1// path:数据保存路径int My_PCA(Mat data, float T, String path){    PCA pca(data, Mat(), CV_PCA_DATA_AS_ROW);    Mat latent = pca.eigenvalues.t();    double latent_sum = sum(latent).val[0];    int len = latent.cols;    float flag_sum = 0;    int i = 0;    while (flag_sum <= T && i < len)                    // 计算达到要求的主成分数    {        flag_sum = flag_sum + latent.ptr<float>(0)[i]/ latent_sum;        i++;    }    Mat _coeff = pca.eigenvectors;    Mat coeff = _coeff(Range(0, i), Range::all());          // 获取主要成分    FileStorage f_pca("path", FileStorage::WRITE);          // 主要参数    f_pca << "num" << i;    f_pca << "mean" << pca.mean;    f_pca << "coff" << coeff;    f_pca.release();    latent.release();    _coeff.release();    coeff.release();    return 0;}

其中将获取后的数据进行保存,方便以后使用。

第二步:主成分分析

#include <opencv2/opencv.hpp>#include <fstream>using namespace cv;using namespace std;// data:输入数据// path:数据保存路径Mat My_PCAs(Mat data, String path){    FileStorage f_pca("path", FileStorage::READ);               int num;    Mat mean, coff;    f_pca["num"] >> num;    f_pca["mean"] >> mean;    f_pca["coff"] >> coff;    f_pca.release();    Mat result = (data - mean)*(coff.t());    mean.release();    coff.release();    return result;}

这里需要加载第一步获取的主成分数据。

主程序:

#include <opencv/cv.h>#include <opencv/highgui.h>#include <stdio.h>#include <stdlib.h>#include <iostream>using namespace cv;using namespace std;int My_PCA(Mat data, float T, String path);Mat My_PCAs(Mat data, String path);#define DIMENTIONS 7#define SAMPLE_NUM 31 float Coordinates[DIMENTIONS*SAMPLE_NUM] = {    101.5, 100.4, 97.0, 98.7, 100.8, 114.2, 104.2    , 100.8, 93.5, 95.9, 100.7, 106.7, 104.3, 106.4    , 100.8, 97.4, 98.2, 98.2, 99.5, 103.6, 102.4    , 99.4, 96.0, 98.2, 97.8, 99.1, 98.3, 104.3    , 101.8, 97.7, 99.0, 98.1, 98.4, 102.0, 103.7    , 101.8, 96.8, 96.4, 92.7, 99.6, 101.3, 103.4    , 101.3, 98.2, 99.4, 103.7, 98.7, 101.4, 105.3    , 101.9, 100.0, 98.4, 96.9, 102.7, 100.3, 102.3    , 100.3, 98.9, 97.2, 97.4, 98.1, 102.1, 102.3    , 99.3, 97.7, 97.6, 101.1, 96.8, 110.1, 100.4    , 98.7, 98.4, 97.0, 99.6, 95.6, 107.2, 99.8    , 99.7, 97.7, 98.0, 99.3, 97.3, 104.1, 102.7    , 97.6, 96.5, 97.6, 102.5, 97.2, 100.6, 99.9    , 98.0, 98.4, 97.1, 100.5, 101.4, 103.0, 99.9    , 101.1, 98.6, 98.7, 102.4, 96.9, 108.2, 101.7    , 100.4, 98.6, 98.0, 100.7, 99.4, 102.4, 103.3    , 99.3, 96.9, 94.0, 98.1, 99.7, 109.7, 99.2    , 98.6, 97.4, 96.4, 99.8, 97.4, 102.1, 100.0    , 98.2, 98.2, 99.4, 99.3, 99.7, 101.5, 99.9    , 98.5, 96.3, 97.0, 97.7, 98.7, 112.6, 100.4    , 98.4, 99.2, 98.1, 100.2, 98.0, 98.2, 97.8    , 99.2, 97.4, 95.7, 98.9, 102.4, 114.8, 102.6    , 101.3, 97.9, 99.2, 98.8, 105.4, 111.9, 99.9    , 98.5, 97.8, 94.6, 102.4, 107.0, 115.0, 99.5    , 98.3, 96.3, 98.5, 106.2, 92.5, 98.6, 101.6    , 99.3, 101.1, 99.4, 100.1, 103.6, 98.7, 101.3    , 99.2, 97.3, 96.2, 99.7, 98.2, 112.6, 100.5    , 100.0, 99.9, 98.2, 98.3, 103.6, 123.2, 102.8    , 102.2, 99.4, 96.2, 98.6, 102.4, 115.3, 101.2    , 100.1, 98.7, 97.4, 99.8, 100.6, 112.4, 102.5    , 104.3, 98.7, 100.2, 116.1, 105.2, 101.6, 102.6};float Coordinates_test[DIMENTIONS] = {    104.3, 98.7, 100.2, 116.1, 105.2, 101.6, 102.6};int main(){    Mat pcaSet(SAMPLE_NUM, DIMENTIONS, CV_32FC1);    //原始数据    Mat Coordinates1(1, DIMENTIONS, CV_32FC1, Coordinates_test);    for (int i = 0; i < SAMPLE_NUM; i++)    {        for (int j = 0; j < DIMENTIONS; j++)        {            pcaSet.at<float>(i, j) = Coordinates[i*j + j];        }    }    My_PCA(pcaSet, 0.9, "pca");//第一步,这里设置占主成分90%以上。    Mat data = My_PCAs(Coordinates1, "pca");//第二步    cout << "data: " << data << endl;    system("pause");}

C++处理结果:
这里写图片描述

MATLAB处理结果:
这里写图片描述

原创粉丝点击