ncnn编译使用(一)

来源：互联网发布：工商名录采集软件编辑：程序博客网时间：2024/06/05 14:25

ncnn前向框架简介

以下介绍来自官网介绍
ncnn 是一个为手机端极致优化的高性能神经网络前向计算框架。ncnn 从设计之初深刻考虑手机端的部署和使用。无第三方依赖，跨平台，手机端 cpu 的速度快于目前所有已知的开源框架。基于 ncnn，开发者能够将深度学习算法轻松移植到手机端高效执行，开发出人工智能 APP，将 AI 带到你的指尖。ncnn 目前已在腾讯多款应用中使用，如 QQ，Qzone，微信，天天P图等。

功能概述

支持卷积神经网络，支持多输入和多分支结构，可计算部分分支
无任何第三方库依赖，不依赖 BLAS/NNPACK 等计算框架
纯 C++ 实现，跨平台，支持 android ios 等
ARM NEON 汇编级良心优化，计算速度极快
精细的内存管理和数据结构设计，内存占用极低
支持多核并行计算加速，ARM big.LITTLE cpu 调度优化
-整体库体积小于 500K，并可轻松精简到小于 300K
可扩展的模型设计，支持 8bit 量化和半精度浮点存储，可导入 caffe 模型
支持直接内存零拷贝引用加载网络模型
可注册自定义层实现并扩展

安装

下载源码完成编译

git clone https://github.com/Tencent/ncnncd ncnnmkdir buildcd buildcmake ..make -jmake install

测试

这里我们测试Alexnet进行分类。模型下载地址：https://dl.caffe.berkeleyvision.org/bvlc_alexnet.caffemodel
由于alexnet是用老版caffe训练完成的，参数保存不一致，为了提升到现有的caffe版本，使用下面命令：

~/caffe/build/tools/upgrade_net_proto_text deploy.prototxt new_deplpy.prototxt~/caffe/build/tools/upgrade_net_proto_binary bvlc_alexnet.caffemodel new_bvlc_alexnet.caffemodel

之后将caffe模型转换为ncnn的模型：

./caffe2ncnn ../../examples/alexnet/deploy.prototxt ../../examples/alexnet/bvlc_alexnet.caffemodel ../../examples/alexnet/alexnet.param alexnet.bin

编写测试代码如下：

#include <iostream>#include <fstream>#include <stdio.h>#include <algorithm>#include <vector>#include <opencv2/core/core.hpp>#include <opencv2/highgui/highgui.hpp>#include "net.h"using namespace std;void read_label(std::string label_path, vector<string> &labels){    ifstream infile;    infile.open(label_path.data());    assert(infile.is_open());        string line;    while(getline(infile, line)){       labels.push_back(line);    }    infile.close();}static int detect_squeezenet(const cv::Mat& bgr, std::vector<float>& cls_scores){    ncnn::Net squeezenet;    squeezenet.load_param("alexnet.param");    squeezenet.load_model("alexnet.bin");    ncnn::Mat in = ncnn::Mat::from_pixels_resize(bgr.data, ncnn::Mat::PIXEL_BGR, bgr.cols, bgr.rows, 227, 227);    const float mean_vals[3] = {104.f, 117.f, 123.f};    in.substract_mean_normalize(mean_vals, 0);    ncnn::Extractor ex = squeezenet.create_extractor();    ex.set_light_mode(true);    ex.input("data", in);    ncnn::Mat out;    ex.extract("prob", out);    cls_scores.resize(out.c);    for (int j=0; j<out.c; j++)    {        const float* prob = out.data + out.cstep * j;        cls_scores[j] = prob[0];    }    return 0;}static int print_topk(const std::vector<float>& cls_scores, int topk, vector<string> labels){    // partial sort topk with index    int size = cls_scores.size();    std::vector< std::pair<float, int> > vec;    vec.resize(size);    for (int i=0; i<size; i++)    {        vec[i] = std::make_pair(cls_scores[i], i);    }    std::partial_sort(vec.begin(), vec.begin() + topk, vec.end(),                      std::greater< std::pair<float, int> >());    // print topk and score    for (int i=0; i<topk; i++)    {        float score = vec[i].first;        int index = vec[i].second;        fprintf(stderr, "%d = %f\n", index, score);        cout << labels[index] << endl;    }    return 0;}int main(int argc, char** argv){    const char* imagepath = argv[1];    cv::Mat m = cv::imread(imagepath, CV_LOAD_IMAGE_COLOR);    if (m.empty())    {        fprintf(stderr, "cv::imread %s failed\n", imagepath);        return -1;    }    vector<string> labels;    read_label("./label.txt", labels);    std::vector<float> cls_scores;    detect_squeezenet(m, cls_scores);    print_topk(cls_scores, 3, labels);    return 0;}

测试结果

为了编译上述代码，我们使用cmake设置编译环境

cmake_minimum_required(VERSION 3.5)find_package(OpenCV REQUIRED core highgui imgproc)#include_directories(${CMAKE_CURRENT_SOURCE_DIR}/../src)#include_directories(${CMAKE_CURRENT_SOURCE_DIR}/../src)include_directories(/home/young/deeplearning/ncnn/build/install/include)link_directories(/home/young/deeplearning/ncnn/build/install/lib)FIND_PACKAGE( OpenMP REQUIRED)  if(OPENMP_FOUND)      message("OPENMP FOUND")      set(CMAKE_C_FLAGS "${CMAKE_C_FLAGS} ${OpenMP_C_FLAGS}")      set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} ${OpenMP_CXX_FLAGS}")      set(CMAKE_EXE_LINKER_FLAGS "${CMAKE_EXE_LINKER_FLAGS} ${OpenMP_EXE_LINKER_FLAGS}")  endif()  add_executable(classify classify.cpp)target_link_libraries(classify ncnn ${OpenCV_LIBS})

编译完成，运行如下命令：

 ./classify ./test.jpg

结果如下：

260 = 0.354059n02112137 狗273 = 0.231026n02115641 狼270 = 0.065178n02114548 狼

这里写图片描述

todo

学习源码，进行优化

阅读全文

0 0