距离变换的理解
来源:互联网 发布:淘宝卖分享教程 编辑:程序博客网 时间:2024/05/16 19:31
当时自己理解的一点小误区,放到这里防止再犯错。
距离变换的基本意思就是计算一个图像中非零像素点到最近的零像素点的距离,也就是到所有零像素点的最短距离。建立距离变换图像可以方便提取骨骼
在opencv中有专门的函数cvDistTransform来计算距离变换图像。
- DistTransform
- 计算输入图像的所有非零元素对其最近零元素的距离
- void cvDistTransform( const CvArr* src, CvArr* dst, int distance_type=CV_DIST_L2,
- int mask_size=3, const float* mask=NULL );
- src
- 输入 8-比特、单通道 (二值) 图像.
- dst
- 含计算出的距离的输出图像(32-比特、浮点数、单通道).
- distance_type
- 距离类型; 可以是 CV_DIST_L1, CV_DIST_L2, CV_DIST_C 或 CV_DIST_USER.
- mask_size
- 距离变换掩模的大小,可以是 3 或 5. 对 CV_DIST_L1 或 CV_DIST_C 的情况,参数值被强制设定为 3, 因为 3×3 mask 给出 5×5 mask 一样的结果,而且速度还更快。
- mask
- 用户自定义距离距离情况下的 mask。 在 3×3 mask 下它由两个数(水平/垂直位量,对角线位移量)组成, 5×5 mask 下由三个数组成(水平/垂直位移量,对角位移和 国际象棋里的马步(马走日))
- 函数 cvDistTransform 二值图像每一个象素点到它最邻近零象素点的距离。对零象素,函数设置 0 距离,对其它象素,它寻找由基本位移(水平、垂直、对角线或knight's move,最后一项对 5×5 mask 有用)构成的最短路径。 全部的距离被认为是基本距离的和。由于距离函数是对称的,所有水平和垂直位移具有同样的代价 (表示为 a ), 所有的对角位移具有同样的代价 (表示为 b), 所有的 knight's 移动具有同样的代价 (表示为 c). 对类型 CV_DIST_C 和 CV_DIST_L1,距离的计算是精确的,而类型 CV_DIST_L2 (欧式距离) 距离的计算有某些相对误差 (5×5 mask 给出更精确的结果), OpenCV 使用 [Borgefors86] 推荐的值:
- CV_DIST_C (3×3):
- a=1, b=1
- CV_DIST_L1 (3×3):
- a=1, b=2
- CV_DIST_L2 (3×3):
- a=0.955, b=1.3693
- CV_DIST_L2 (5×5):
- a=1, b=1.4, c=2.1969
DistTransform计算输入图像的所有非零元素对其最近零元素的距离void cvDistTransform( const CvArr* src, CvArr* dst, int distance_type=CV_DIST_L2, int mask_size=3, const float* mask=NULL );src输入 8-比特、单通道 (二值) 图像.dst含计算出的距离的输出图像(32-比特、浮点数、单通道).distance_type距离类型; 可以是 CV_DIST_L1, CV_DIST_L2, CV_DIST_C 或 CV_DIST_USER.mask_size距离变换掩模的大小,可以是 3 或 5. 对 CV_DIST_L1 或 CV_DIST_C 的情况,参数值被强制设定为 3, 因为 3×3 mask 给出 5×5 mask 一样的结果,而且速度还更快。mask用户自定义距离距离情况下的 mask。 在 3×3 mask 下它由两个数(水平/垂直位量,对角线位移量)组成, 5×5 mask 下由三个数组成(水平/垂直位移量,对角位移和 国际象棋里的马步(马走日)) 函数 cvDistTransform 二值图像每一个象素点到它最邻近零象素点的距离。对零象素,函数设置 0 距离,对其它象素,它寻找由基本位移(水平、垂直、对角线或knight's move,最后一项对 5×5 mask 有用)构成的最短路径。 全部的距离被认为是基本距离的和。由于距离函数是对称的,所有水平和垂直位移具有同样的代价 (表示为 a ), 所有的对角位移具有同样的代价 (表示为 b), 所有的 knight's 移动具有同样的代价 (表示为 c). 对类型 CV_DIST_C 和 CV_DIST_L1,距离的计算是精确的,而类型 CV_DIST_L2 (欧式距离) 距离的计算有某些相对误差 (5×5 mask 给出更精确的结果), OpenCV 使用 [Borgefors86] 推荐的值:CV_DIST_C (3×3):a=1, b=1CV_DIST_L1 (3×3):a=1, b=2CV_DIST_L2 (3×3):a=0.955, b=1.3693CV_DIST_L2 (5×5):a=1, b=1.4, c=2.1969
其中mask刚开始不是很理解,经过模拟数据得到了其含义。
a\b分别表示在水平垂直方向的距离,?/问号部分表示根据a和b的值的大小再确定其值。
如果定义了c值(用户自定义mask或者选择CV_DIST_L2等)在变为
所以定义c的时候必须是5*5的mask,然后在往外扩充的时候类似上面的问号类型,找到最小距离即可。
下面代码表示自己创建一个9*9的矩阵,然后利用该函数计算其值:
- //距离变换代码,在微软的那个ppt中用来计算掌心的位置可能用到这个
- //部分内容在http://www.opencv.org.cn/forum/viewtopic.php?f=1&t=4574&start=0有解释
- #include <iostream>
- #include "highgui.h"
- #include "cv.h"
- using namespace std;
- int main()
- {
- IplImage *src = cvCreateImage(cvSize(9, 9), 8, 1);
- cvZero(src);
- uchar *ptr = (uchar*)(src->imageData);
- *ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0; *ptr++ = 0;*ptr++ = 0;ptr +=3;
- *ptr++ = 0;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 0;*ptr++ = 0; *ptr++ = 0;*ptr++ = 0;ptr +=3;
- *ptr++ = 0;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255; *ptr++ = 0;*ptr++ = 0;ptr +=3;
- *ptr++ = 0;*ptr++ = 0;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 0;*ptr++ = 0;ptr +=3;
- *ptr++ = 0;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 0;ptr +=3;
- *ptr++ = 0;*ptr++ = 0;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 0;*ptr++ = 0;ptr +=3;
- *ptr++ = 0;*ptr++ = 0;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255; *ptr++ = 0;*ptr++ = 0;ptr +=3;
- *ptr++ = 0;*ptr++ = 0;*ptr++ = 255;*ptr++ = 0;*ptr++ = 255;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0; ptr +=3;
- *ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;
- IplImage *dist = cvCreateImage( cvGetSize(src), IPL_DEPTH_32F, 1 );
- cvDistTransform( src, dist, CV_DIST_L1, 3, NULL, NULL );
- /*cvConvertScale( dist, dist, 1000.0, 0 );
- cvShowImage("dist2", dist);
- cvPow( dist, dist, 0.5 );
- cvShowImage("dist3", dist);
- IplImage *dist32s = cvCreateImage(cvGetSize(src), IPL_DEPTH_32S, 1);
- cvConvertScale( dist, dist32s, 1.0, 0.5 );
- cvShowImage("dist32s", dist32s);
- cvAndS( dist32s, cvScalarAll(255), dist32s, 0 );
- cvShowImage("dist32s2", dist32s);
- IplImage *dist8u1 = cvCloneImage(src);
- cvConvertScale( dist32s, dist8u1, 1, 0 );
- cvShowImage("dist8u1", dist8u1);*/
- for (int y=0; y<src->height; y++)
- {
- uchar *pt = (uchar*)(src->imageData+y*src->widthStep);
- for (int x=0; x<src->width; x++)
- {
- cout << int(pt[x]) << '\t';
- }
- cout << endl;
- }
- cout << endl << endl;
- for (int y=0; y<dist->height; y++)
- {
- float *p = (float *)(dist->imageData+y*dist->widthStep);//因为输出图像必须是浮点型数据,所以这里必须采用float。也是自己一开始做错的。虽然IplImage->imageData是char型的,但是针对不同类型(字节型浮点型)要有不同的处理方式
- for (int x=0; x<dist->width; x++)
- {
- cout << float(p[x]) << '\t';
- }
- cout << endl;
- }
- cvShowImage("src",src);
- cvShowImage("dist", dist);
- cvWaitKey(0);
- return 0;
- }
//距离变换代码,在微软的那个ppt中用来计算掌心的位置可能用到这个//部分内容在http://www.opencv.org.cn/forum/viewtopic.php?f=1&t=4574&start=0有解释#include <iostream>#include "highgui.h"#include "cv.h"using namespace std;int main(){IplImage *src = cvCreateImage(cvSize(9, 9), 8, 1);cvZero(src);uchar *ptr = (uchar*)(src->imageData);*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0; *ptr++ = 0;*ptr++ = 0;ptr +=3;*ptr++ = 0;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 0;*ptr++ = 0; *ptr++ = 0;*ptr++ = 0;ptr +=3;*ptr++ = 0;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255; *ptr++ = 0;*ptr++ = 0;ptr +=3;*ptr++ = 0;*ptr++ = 0;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 0;*ptr++ = 0;ptr +=3;*ptr++ = 0;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 0;ptr +=3;*ptr++ = 0;*ptr++ = 0;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 0;*ptr++ = 0;ptr +=3;*ptr++ = 0;*ptr++ = 0;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255; *ptr++ = 0;*ptr++ = 0;ptr +=3;*ptr++ = 0;*ptr++ = 0;*ptr++ = 255;*ptr++ = 0;*ptr++ = 255;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0; ptr +=3;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;IplImage *dist = cvCreateImage( cvGetSize(src), IPL_DEPTH_32F, 1 );cvDistTransform( src, dist, CV_DIST_L1, 3, NULL, NULL );/*cvConvertScale( dist, dist, 1000.0, 0 );cvShowImage("dist2", dist);cvPow( dist, dist, 0.5 );cvShowImage("dist3", dist);IplImage *dist32s = cvCreateImage(cvGetSize(src), IPL_DEPTH_32S, 1);cvConvertScale( dist, dist32s, 1.0, 0.5 );cvShowImage("dist32s", dist32s);cvAndS( dist32s, cvScalarAll(255), dist32s, 0 );cvShowImage("dist32s2", dist32s);IplImage *dist8u1 = cvCloneImage(src);cvConvertScale( dist32s, dist8u1, 1, 0 );cvShowImage("dist8u1", dist8u1);*/for (int y=0; y<src->height; y++){uchar *pt = (uchar*)(src->imageData+y*src->widthStep);for (int x=0; x<src->width; x++){cout << int(pt[x]) << '\t';}cout << endl;}cout << endl << endl;for (int y=0; y<dist->height; y++){float *p = (float *)(dist->imageData+y*dist->widthStep);//因为输出图像必须是浮点型数据,所以这里必须采用float。也是自己一开始做错的。虽然IplImage->imageData是char型的,但是针对不同类型(字节型浮点型)要有不同的处理方式for (int x=0; x<dist->width; x++){cout << float(p[x]) << '\t';}cout << endl;}cvShowImage("src",src);cvShowImage("dist", dist);cvWaitKey(0);return 0;}运行结果
如果将距离运算改为CV_DIST_L2运行结果:
因为一开始栽倒数据访问上了,所以有必要将opencv中像素访问方式贴出来,方便以后查阅。csnd编辑界面太差了,一堆乱码,大家还是移步到:http://www.opencv.org.cn/index.php/OpenCV_编程简介(矩阵/图像/视频的基本读写操作)
- 距离变换的理解
- OpenCV 距离变换的笔记
- 图像的距离变换---扫描
- 距离变换
- 距离变换
- 距离变换
- 距离变换
- 距离变换
- 距离变换
- 距离变换
- 距离变换
- 距离变换
- 距离变换
- 距离变换
- 距离变换
- 距离变换
- 距离变换
- 距离变换
- 宏的简单应用(得出数组中的最大值)
- DDR,GDDR,LPDDR,QDR...谈谈现在主流的内存
- Android Makefile 文件讲解
- Windows Phone学习笔记:创建用户界面
- PHP工资管理系统、考勤管理系统、薪资管理系统
- 距离变换的理解
- jquery ajax success中的函数不执行的原因
- Android学习之 学习资料
- csdn登录成功
- C#中实现Delphi中的StrMove(,,,)方法
- error LNK2019: 无法解析的外部符号 _MCIWndCreateW
- 对于大学生活<补>
- Unix/Linux下C/C++开发技术概览
- 查看SUSE LINUX版本