YOLO v2 CPU 使用 openblas 加速
来源:互联网 发布:怎么在淘宝论坛发帖子 编辑:程序博客网 时间:2024/06/02 03:12
YOLO v2是近来出现效果惊艳的目标检测方法。但即使是在普通GPU上跑到上百帧/秒的tiny-yolo模型,在CPU上也会下降到数帧/每秒,这是由于其并没有对CPU计算加速造成的。
阅读其代码,发现其并没有使用caffe等常用的openblas进行加速,因此很有必要对其加上,为了和原代码风格保持一致,本文定义了一个宏USE_OPENBLAS来控制是否使用openblas加速,openblas库可以在http://www.openblas.net/获得。
其实现矩阵乘法计算的代码在src/gemm.c里,在文件开头加上如下代码:
#if USE_OPENBLAS#include "OpenBLAS/cblas.h"#if _WIN32#pragma comment(lib,"libopenblas.dll.a")#endif#endif
然后定位gemm函数,替换成openblas的实现
void gemm(int TA, int TB, int M, int N, int K, float ALPHA, float *A, int lda, float *B, int ldb, float BETA, float *C, int ldc){#if USE_OPENBLAScblas_sgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans, M, N, K, ALPHA, A, lda, B, ldb, BETA, C, ldc);#else gemm_cpu( TA, TB, M, N, K, ALPHA,A,lda, B, ldb,BETA,C,ldc);#endif}
阅读全文
0 0
- YOLO v2 CPU 使用 openblas 加速
- ubuntu上Caffe使用OpenBLAS多线程加速
- ubuntu上Caffe使用OpenBLAS多线程加速
- yolo v2
- YOLO V2
- YOLO v2
- yolo V2
- 【YOLO学习】使用YOLO v2训练自己的数据
- 【YOLO学习】使用YOLO v2训练自己的数据
- DNN:windows使用 YOLO V1,V2
- Windows使用OpenBLAS加速R语言计算速度
- Caffe:CPU模式下使用openblas-openmp(多线程版本)
- Caffe:CPU模式下使用openblas-openmp(多线程版本)
- yolo v2微调
- YOLO v2 reorg 学习
- yolo v2 笔记
- yolo v2解读
- yolo-face 使用yolo v2 在CelebA上训练的人脸检测器
- Ubuntu下ssh连接显示图形界面
- 60个国外免费3D模型下载网站
- ubuntu/deepin安装Scrapy
- ubantu下的搜狗输入法安装
- CTS、CTS-V、GTS版本更新,及其注意事项
- YOLO v2 CPU 使用 openblas 加速
- 牛客网解题-2017网易雷火实习生笔试题
- 4-5 基础堆排序和Heapify(两个版本的基于堆的排序算法)
- STM32半主机模式
- apt-get update 失败
- 代理设计模式1(知识点总结)
- HashSet如何重写了hashcode()和equals()
- Android 手机卫士(6)消息处理机制
- 《算法与数据结构》学习笔记 4-6 优化的堆排序(原地堆排序)