opencv k近邻

来源:互联网 发布:cms管理系统模板 编辑:程序博客网 时间:2024/05/16 00:34

K Nearest Neighbors

计算待测数据与样本库中每个样本的距离,得到距离最小的前K个,进行投票表决,前K个中某一类的样本数最多,则判断待测数据为此类。

一、opencv 中主要的函数有:

(1)CvKNearest::train     训练KNN模型

[html] view plaincopy
  1. bool CvKNearest::train( const CvMat* _train_data, const CvMat* _responses,   
  2.                         const CvMat* _sample_idx=0, bool is_regression=false,   
  3.                         int _max_k=32, bool _update_base=false );   

这个类的方法训练K近邻模型。它遵循一个一般训练方法约定的限制:只支持CV_ROW_SAMPLE数据格式,输入向量必须都是有序的,而输出可以是 无序的(当is_regression=false),可以是有序的(is_regression=true)。并且变量子集和省略度量是不被支持的。

参数_max_k 指定了最大邻居的个数,它将被传给方法find_nearest。参数 _update_base 指定模型是由原来的数据训练(_update_base=false),还是被新训练数据更新后再训练(_update_base=true)。在后一种情况下_max_k 不能大于原值, 否则它会被忽略。

(2)CvKNearest::find_nearest  寻找输入向量的最近邻

[html] view plaincopy
  1. float CvKNearest::find_nearest( const CvMat* _samples, int k, CvMat* results=0,   
  2.         const float** neighbors=0, CvMat* neighbor_responses=0, CvMat* dist=0 ) const;   

对每个输入向量(表示为matrix_sample的每一行),该方法找到k(k≤get_max_k() )个最近邻。在回归中,预测结果将是指定向量的近邻的响应的均值。在分类中,类别将由投票决定。

对传统分类和回归预测来说,该方法可以有选择的返回近邻向量本身的指针(neighbors, array of k*_samples->rows pointers),它们相对应的输出值(neighbor_responses, a vector of k*_samples->rows elements) ,和输入向量与近邻之间的距离(dist, also a vector of k*_samples->rows elements)。

对每个输入向量来说,近邻将按照它们到该向量的距离排序。

对单个输入向量,所有的输出矩阵是可选的,而且预测值将由该方法返回。

 

二、CvMat用法

CvMat* trainData;//存储样本数据
CvMat* trainClasses;//存储类的标号

int totalTrainNum;//总训练样本数

int featureNum;//训练样本维数

trainData = cvCreateMat( totalTrainNum, featureNum, CV_32FC1 ); 
 trainClasses = cvCreateMat( totalTrainNum, 1, CV_32FC1 );

cvmSet(trainClasses,i,0,1); //设置cvMat第几行第几列的某个数为

得到判断结果和准确度计算如下:

//其中test为待测数据的特征向量

[html] view plaincopy
  1. CvMat* nearest=cvCreateMat(1,K,CV_32FC1);  
  2.  float result=knn->find_nearest(test,K,0,0,nearest,0); //所得结果  
  3.   
  4.  int accuracy=0;//前K个样本中属于此类的样本数  
  5.   
  6.  for(int i=0;i<K;i++){  
  7.   
  8.   if( nearest->data.fl[i] == result)  
  9.    accuracy++;  
  10.  }  
  11.  float pre=100*((float)accuracy/(float)K); //准确度  
  12.  printf("|\t%.0f\t| \t%.2f%%  \t| \t%d of %d \t| \n",result,pre,accuracy,K);  

 

0 0
原创粉丝点击