【配置】vs13+opencv2.4.9+cuda6.5+64位win7编译配置

来源：互联网发布：用什么画网络拓扑图编辑：程序博客网时间：2024/06/05 09:44

2017/12/12–2017/12/14

记录过程

最近需要计算光流，试了几种方法，想看一下哪种算法的效果比较好，然后想用到brox光流法，opencv中已经包含这个算法，但是，需要用到GPU！！！所以以前编译的opencv已经不能弄了，需要重新编译一个支持GPU的版本。

首先记录一下编译过程，并注明过程中出现哪些错误
然后注明测试过程出现的错误，以及可能会解决的方法
最后是其他一些错误

参考链接：http://blog.csdn.net/zxj820/article/details/50821036
感谢

一、准备

首先注意一点，在整个过程中最好不要出现中文路径。

1、安装cmake

2、安装cuda6.5

3、下载opencv2.4.9源文件

4、安装vs2013

5、安装intel tbb库

6、python2.7（可选）

以上安装包在参考链接中都有给出。

二、配置

1、解压opencv2.4.9

2、解压tbb，并添加路径到系统环境变量path中。

即右击计算机–属性–高级系统设置–环境变量–用户变量–path

添加一下路径（即你的tbb的路径），每个路径之间用英文分号隔开。

D:\tbb43_20150424oss\bin\intel64\vc12;
D:\tbb43_20150424oss\include;
D:\tbb43_20150424oss\lib\intel64

3、配置cmake

3.1 打开cmake，添加一下内容：

where is the source code：你的opencv中source文件路径，如：D:\opencv\sourceswhere to build the binaries：一个新路径，用来存放你编译生成的文件，如：D:\opencv\newmake勾选Advanced

这里写图片描述

3.2 点 Configure，选择编译器，选择 ‘Visual Studio 12 2013 Win64′

3.3 配置cuda选项

取消 ‘BUILD_DOCS’ 和 ‘BUILD_EXAMPLES’取消 ‘CUDA_ATTACH_VS_BUILD_RULE_TO_CUDA_FILE’检查 ‘CMAKE_LINKER’, 保证是 Visual Studio 12.0 （vs2013）的路径勾上 ‘WITH_CUBLAS’, ‘WITH_CUDA’, ‘WITH_OPENGL’, ‘WITH_TBB’选择 CUDA_GENERATION：可以查看NVIDIA官网，你的显卡的架构。点击 Configure 刷新配置

3.4 配置tbb选项

设置'TBB_INCLUDE_DIRS'，例如“D:\toolkits\tbb43_20140724oss\include”点击 Configure 然后可以看到TBB_LIB_DIR和TBB_STDDEF_PATH下的目录自动有了，但是可能是错的，需要改到 Debug 和 Release 文件夹的上级目录为止。例如 D:/toolkits/tbb43_20140724oss/lib/intel64/vc12〃

这里写图片描述

点击 Configure 刷新，如果在下方信息框中有：Use TBB: YES(ver 4.1 interface 6105)，Use Cuda: YES(ver5.0)，证明我们已经将inteltbb和CUDA正确配置。

3.5 点击generate，生成OpenCV.sln文件

三、编译

1、用vs2013以管理员的身份打开OpenCV.sln文件。

2、在编译之前，需要修改opencv-2.4.9\modules\gpu\src\nvidia\core\NCV.cu文件内容，添加#include <algorithm>，保证max函数调用不会出错。

3、进行编译，中文是生成，应为是build。

分别在X64下的DEBUG和RELEASE下各生成一次。建议先生成release的，因为这个不会有错误。首先对 **opencv_core** 和 **opencv_gpu** 两个文件右击，点击生成。前者相对较快，后者大约会两三个小时左右。然后对**ALL_BUILD** 右击，生成。然后对**INSTALL** 右击，生成。

在这个过程中如果你装过python，可能debug下会出现

error LNK1104: 无法打开文件“python27_d.lib” C:\OpenCV\VS2013_64\modules\python\LINK opencv_python

这个错误，可以参考博客中的方法，将会使用到python27_d.lib的代码中替换为python27.lib。然后重新编译。

编译完成后，重新加载。

四、配置环境

如果你之前配置过opencv，那么请删除之前所有的路径，配置新的。

1、首先配置系统环境变量。

新建opencv路径：

这里写图片描述

配置path路径，添加

D:\opencv\newmake\install\x64\vc12\lib

2、打开vs2013，新建cuda项目，配置环境。

分别在X64（如果没有，则新建）的Debug和Release上的Microsoft.Cpp.Win64.user上，右击，属性—VC++目录：进行修改：

包含目录：
D:opencv\newmake\install\include；
D:opencv\newmake\install\include\opencv；
D:opencv\newmake\install\include\opencv2；

可执行文件目录：
D:\tbb43_20150424oss\bin\intel64\vc12
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v6.5\bin

库目录：
D:opencv\newmake\install\x64\vc12\lib

然后在属性–链接器–附加依赖项中添加：（如果之前配置过opencv，这里不需要改）

opencv_calib3d249d.libopencv_contrib249d.libopencv_core249d.libopencv_features2d249d.libopencv_flann249d.libopencv_gpu249d.libopencv_highgui249d.libopencv_imgproc249d.libopencv_legacy249d.libopencv_ml249d.libopencv_nonfree249d.libopencv_objdetect249d.libopencv_ocl249d.libopencv_photo249d.libopencv_stitching249d.libopencv_superres249d.libopencv_ts249d.libopencv_video249d.libopencv_videostab249d.libopencv_calib3d249.libopencv_contrib249.libopencv_core249.libopencv_features2d249.libopencv_flann249.libopencv_gpu249.libopencv_highgui249.libopencv_imgproc249.libopencv_legacy249.libopencv_ml249.libopencv_nonfree249.libopencv_objdetect249.libopencv_ocl249.libopencv_photo249.libopencv_stitching249.libopencv_superres249.libopencv_ts249.libopencv_video249.libopencv_videostab249.lib

好了，至此，所有配置已经完成了，那么现在重启一下电脑吧。

五、验证

一共四个验证，前两个可行，后两个有错误，试图解决错误。

1、验证1：简单的图像基本操作，可行：

#include <iostream>#include <opencv.hpp>using namespace std;using namespace cv;#if 1void main(){    Mat img = imread("groot.jpg");    Mat gray;    cvtColor(img, gray, CV_BGR2GRAY);    imshow("1", img);    imshow("2", gray);    waitKey(0);    system("pause");}#else#endif

这里写图片描述

另外，这验证中出现错误：错误 1 error LNK1104: 无法打开文件“opencv_calib3d249d.lib”

然后你需要查看属性中的VC++添加的目录，是否是都配置好的，

如果没有配好，则重新配置环境。

如果遇到目录为空，但是点击编辑发现有路径，可以继承父类，然后就发现有路径了。

这里写图片描述

2、验证2：建立cuda项目，默认kernel.cu文件可行

#include "cuda_runtime.h"#include "device_launch_parameters.h"#include <iostream>#include <stdio.h>cudaError_t addWithCuda(int *c, const int *a, const int *b, unsigned int size);__global__ void addKernel(int *c, const int *a, const int *b){    int i = threadIdx.x;    c[i] = a[i] + b[i];}#if 1int main(){    const int arraySize = 5;    const int a[arraySize] = { 1, 2, 3, 4, 5 };    const int b[arraySize] = { 10, 20, 30, 40, 50 };    int c[arraySize] = { 0 };    // Add vectors in parallel.    cudaError_t cudaStatus = addWithCuda(c, a, b, arraySize);    if (cudaStatus != cudaSuccess) {        fprintf(stderr, "addWithCuda failed!");        return 1;    }    printf("{1,2,3,4,5} + {10,20,30,40,50} = {%d,%d,%d,%d,%d}\n",        c[0], c[1], c[2], c[3], c[4]);    // cudaDeviceReset must be called before exiting in order for profiling and    // tracing tools such as Nsight and Visual Profiler to show complete traces.    cudaStatus = cudaDeviceReset();    if (cudaStatus != cudaSuccess) {        fprintf(stderr, "cudaDeviceReset failed!");        return 1;    }    system("pause");    return 0;}#else#endif// Helper function for using CUDA to add vectors in parallel.cudaError_t addWithCuda(int *c, const int *a, const int *b, unsigned int size){    int *dev_a = 0;    int *dev_b = 0;    int *dev_c = 0;    cudaError_t cudaStatus;    // Choose which GPU to run on, change this on a multi-GPU system.    cudaStatus = cudaSetDevice(0);    if (cudaStatus != cudaSuccess) {        fprintf(stderr, "cudaSetDevice failed!  Do you have a CUDA-capable GPU installed?");        goto Error;    }    // Allocate GPU buffers for three vectors (two input, one output)    .    cudaStatus = cudaMalloc((void**)&dev_c, size * sizeof(int));    if (cudaStatus != cudaSuccess) {        fprintf(stderr, "cudaMalloc failed!");        goto Error;    }    cudaStatus = cudaMalloc((void**)&dev_a, size * sizeof(int));    if (cudaStatus != cudaSuccess) {        fprintf(stderr, "cudaMalloc failed!");        goto Error;    }    cudaStatus = cudaMalloc((void**)&dev_b, size * sizeof(int));    if (cudaStatus != cudaSuccess) {        fprintf(stderr, "cudaMalloc failed!");        goto Error;    }    // Copy input vectors from host memory to GPU buffers.    cudaStatus = cudaMemcpy(dev_a, a, size * sizeof(int), cudaMemcpyHostToDevice);    if (cudaStatus != cudaSuccess) {        fprintf(stderr, "cudaMemcpy failed!");        goto Error;    }    cudaStatus = cudaMemcpy(dev_b, b, size * sizeof(int), cudaMemcpyHostToDevice);    if (cudaStatus != cudaSuccess) {        fprintf(stderr, "cudaMemcpy failed!");        goto Error;    }    // Launch a kernel on the GPU with one thread for each element.    addKernel<<<1, size>>>(dev_c, dev_a, dev_b);    // Check for any errors launching the kernel    cudaStatus = cudaGetLastError();    if (cudaStatus != cudaSuccess) {        fprintf(stderr, "addKernel launch failed: %s\n", cudaGetErrorString(cudaStatus));        goto Error;    }    // cudaDeviceSynchronize waits for the kernel to finish, and returns    // any errors encountered during the launch.    cudaStatus = cudaDeviceSynchronize();    if (cudaStatus != cudaSuccess) {        fprintf(stderr, "cudaDeviceSynchronize returned error code %d after launching addKernel!\n", cudaStatus);        goto Error;    }    // Copy output vector from GPU buffer to host memory.    cudaStatus = cudaMemcpy(c, dev_c, size * sizeof(int), cudaMemcpyDeviceToHost);    if (cudaStatus != cudaSuccess) {        fprintf(stderr, "cudaMemcpy failed!");        goto Error;    }Error:    cudaFree(dev_c);    cudaFree(dev_a);    cudaFree(dev_b);    return cudaStatus;}

这里写图片描述

3、验证3：使用gpu：：mat加载，有错误：

#include <opencv2/opencv.hpp>  #include <opencv2/gpu/gpu.hpp>  using namespace cv;using namespace cv::gpu;#if 1int main(){    int num_devices = cv::gpu::getCudaEnabledDeviceCount();    if (num_devices <= 0)    {        std::cerr << "There is no device. " << std::endl;        return -1;    }    std::cerr << "getCudaEnabledDeviceCount NUM :" << num_devices << std::endl;    cv::Mat srcImage = cv::imread("test.jpg");    cv::Mat dstImage;    cv::gpu::GpuMat d_srcImage;//upload image to GPU      cv::gpu::GpuMat d_dstImage;    d_srcImage.upload(srcImage);//中断    cv::gpu::cvtColor(d_srcImage, d_dstImage, CV_BGR2GRAY);    d_dstImage.download(dstImage);    cv::imshow("RGB", srcImage);    cv::imshow("gray", dstImage);    cv::waitKey(0);    return 0;}#else#endif

出现问题：

OpenCV Error: Assertion failed (!m.empty()) in cv::gpu::GpuMat::upload, file D:\
opencv\sources\modules\core\src\gpumat.cpp, line 595

解决方法：

d_srcImage.upload(srcImage);//这句出现了中断

不知道在我干了什么之后，就突然可以了，也算是已解决吧。

改过一个地方，因为我的笔记本有两个显卡，要用NVIDIA的显卡，所以去开始我们安装的cuda中，打开，将其中选项都改成了true。

这里写图片描述

可能是之前没有选用NVIDIA显卡，导致上载出错的吧。

4、验证4：建立cuda项目，查看gpu设备信息，出现错误。

#if 1#include<stdlib.h>    #include<device_launch_parameters.h>    #include<cuda_runtime.h>    #include<opencv2\opencv.hpp>    #include<opencv2\gpu\gpu.hpp>  #include <stdio.h>int main(){    int num_devices = cv::gpu::getCudaEnabledDeviceCount();    if (num_devices <= 0)    {        std::cerr << "There is no devoce" << std::endl;        return -1;    }    int enable_device_id = -1;    for (int i = 0; i < num_devices; i++)    {        cv::gpu::DeviceInfo dev_info(i);//这句中断了        if (dev_info.isCompatible())        {            enable_device_id = i;        }    }    if (enable_device_id < 0)    {        std::cerr << "GPU module isn't built for GPU" << std::endl;        return -1;    }    cv::gpu::setDevice(enable_device_id);    return 0;}#else#endif

直接运行，错误：

“f:\dd\vctools\crt\crtw32\stdio\fopen.c”

这里写图片描述

调试，错误：

OpenCV Error: Gpu API call (unknown error) in DeviceProps::get, file D:\opencv\s
ources\modules\dynamicuda\include\opencv2/dynamicuda/dynamicuda.hpp, line 551

解决方法：

cv::gpu::DeviceInfo dev_info(i);//这句中断了

调试时发现name没有初始化，没有获取到信息。

目前还没解决。

坑

但是，虽然这个问题没解决，但是其他用到gpu的地方都是好的，且设备信息是读的出来的。

六、最后

cuda编译opencv就是为了用Brox光流，现在也可以用了，撒花完结！！！

阅读全文

0 0