OpenMP: 程序for循环并行效率优化
来源:互联网 发布:2017人工智能大会 编辑:程序博客网 时间:2024/05/16 15:21
#pragma omp parallel for 这条语句是用来指定后面的for循环语句变成并行执行的,将for循环里的语句变成并行执行后效率会不会提高呢?还是测试一 下吧,测试的时候,循环最好大一些,增加计算量,不然程序耗时太短,很难区分。
#include <omp.h> #include <stdio.h> #include <time.h> void test() { int a = 0; for(int i = 0; i < 10000000; i++) { a = i + 1; } } int main() { int nthrds = 4; omp_set_num_threads(nthrds); timeval tStart,cTime; long long tPassed = 0; gettimeofday(&tStart, 0); for (int i = 0; i < 100; i++) { test(); } gettimeofday(&cTime, 0); cTime.tv_sec -= tStart.tv_sec; cTime.tv_usec -= tStart.tv_usec; tPassed = 1000000LL * cTime.tv_sec + cTime.tv_usec; tPassed /= 1000; printf("Time = %lld/n", tPassed); gettimeofday(&tStart, 0); #pragma omp parallel for for (int i = 0; i < 100; i++) { test(); } gettimeofday(&cTime, 0); cTime.tv_sec -= tStart.tv_sec; cTime.tv_usec -= tStart.tv_usec; tPassed = 1000000LL * cTime.tv_sec + cTime.tv_usec; tPassed /= 1000; printf("Time = %lld/n", tPassed); return 1; }
在四核的机器上,开了四个线程,加速比基本上是4,果然不错。
此外,BS一下clock()函数,我向来觉得它一无是处。。。
#include <omp.h> #include <stdio.h> #include <time.h> void test() { int a = 0; for(int i = 0; i < 10000000; i++) { a = i + 1; } } int main() { int nthrds = 4; omp_set_num_threads(nthrds); long start = clock(); for (int i = 0; i < 100; i++) { test(); } long end = clock(); printf("Time = %ld/n", end - start); start = clock(); #pragma omp parallel for for (int i = 0; i < 100; i++) { test(); } end = clock(); printf("Time = %ld/n", end - start); return 1; }
结果时间上却没有改善。
clock有三个问题:
1)如果超过一个小时,将要导致溢出.
2)函数clock没有考虑CPU被子进程使用的情况.
3)也不能区分用户空间和内核空间.
- OpenMP: 程序for循环并行效率优化
- OpenMP程序 for 循环并行的效率
- 程序优化之并行OpenMP
- OpenMP循环并行化for的约束条件
- OpenMP循环并行化for的约束条件
- Qt下使用OpenMP并行for循环
- OpenMP并行程序设计——for循环并行化详解
- OpenMP并行程序设计——for循环并行化详解
- OpenMP并行程序设计——for循环并行化详解
- OpenMP并行程序设计——for循环并行化详解
- OpenMP并行程序设计——for循环并行化详解
- OpenMP并行程序设计——for循环并行化详解
- OpenMP并行程序设计—for循环并行化详解
- OpenMP并行程序设计——for循环并行化详解
- OpenMP并行程序设计——for循环并行化详解
- OpenMP并行程序设计——for循环并行化详解
- OpenMP并行程序设计——for循环并行化详解
- 优化for循环效率
- 标识符命名规则
- Uva - 11825 - Hackers' Crackdown(状态压缩dp)
- SQL查询超时的设置方法
- 打印出所有的“水仙花数”,所谓“水仙花数”是指一个三位数,其各位数字立方和等于该数本身。例如:153是一个“水仙花数”,因为153=1的三次方+5的三次方+3的三次方
- hdu 4544 湫湫系列故事——消灭兔子(优先队列+贪心)
- OpenMP: 程序for循环并行效率优化
- [算法] poj 1274 The Perfect Stall (匈牙利)
- 你的搜索其实很糟糕?
- Hadoop1.0.4集群安装
- Android基于box2d开发弹弓类游戏[0]
- 符号链接与硬链接的区别
- 查看seesion 信息
- java中的反射一(Class类的认识)
- NSIS 如果让插件调用回调