在细节上提升你的程序的性能
来源:互联网 发布:数据如何用图表表示 编辑:程序博客网 时间:2024/04/29 06:37
虽然,这些使用方法看似差别不大,在现在的cpu运行期起来几乎上可以忽略不计,
但是,我们想一下现在软件,每一个都是那么的庞大,一个小项目都是几万行代码,
一个函数中你消耗一点,那么多函数是很大的性能消耗的。举一个不恰当的例子,
如果在百度首页中,每天几亿次的点击率,每一个函数里面都有一个无用++运算,这个i++可以小视吗?
下面的例子是我在虚拟机中运行,其中也会有机器性能不好的原因,但是我觉得这样才会将问题展示的更加的严重。
1.不要将函数作为循环的条件
SIZE= 1024
program 1: time:29ms
p = &a;
for( ; i < SIZE *sizeof(int); i++)
{
p = 1;
p++;
}
program 2: time:1ms
p = &a;
len = SIZE *sizeof(int);
for( ; i < len; i++)
{
p = 1;
p++;
}
原因:因为每次比较条件,函数都需要重新计算的,将会消耗时间。
2. 减少内存访问次数
program:1 time:1ms
i = 0;
for( ; i < 1024; i++)
for( ; i < 1024; i++)
tmp ++;
program:2 time:7ms
i = 0;
for( ; i < 1024; i++)
tmp = tmp + 1;
原因:内存与cpu的频率差别很大,尽量减少cpu对内存的访问,减少变量引用;
3.去除不必要的分支
program:1 time:3ms
i = 0;
for (tmp = 0; tmp < 100; tmp++)
{
max = min = a[0] ;
for( ; i < 100; i++)
{
if (max > a[i]) max = a[i];
if (min < a[i]) min = a[i];
}
}
program:2 time:2ms
i = 0;
for (tmp = 0; tmp < 100; tmp++)
{
max = min = a[0] ;
for( ; i < 100; i++)
{
if (max > a[i]) max = a[i];
else if (min < a[i]) min = a[i];
}
}
注意:这个平时写代码的时候注意方可,很多时候书上都是这样的写的,大家觉得没什么?不影响程序的运行结果。所以,没有注意。
4.间接寻址比基地址寻址慢,所以将结构体中常用的成员放前面,并且放在一起。(类、接口、文件同理)
program 1: time:11ms
i = 0;
for( ; i < 1000; i++)
{
t.t1 = 1;
t.t3 = 1;
}
program 1: time:7ms
i = 0;
for( ; i < 1000; i++)
{
t.t1 = 1;
t.t2 = 1;
}
原因:将数据放到同一内存页中,减少页面切换,增加缓存的命中率。
a[i][j]与a[j][i]性能差别的原因
一下内容仅是个人理解,有错误之处,望大家谅解和指正。
a[i][j]使用时间:94s
for( k = 0 ; k <10000 ; k++ )
for( i = 0 ; i<MAX; i++ )
for( j = 0;j < MAX; j++ )
a[i][j] = 0;
a[j][i]使用时间:488s
for( k = 0 ; k < 10000 ; k++ )
for( i = 0 ; i<MAX; i++ )
for( j = 0;j < MAX; j++ )
a[j][i] = 0;
我将两种方法使用gcc生成了汇编代码。使用diff比较只发现了一下四句汇编代码的不同
1c1
< .file"array.c"
---
> .file"array1.c"
31c31
< movl4194352(%esp), %eax
---
> movl4194356(%esp), %eax
33c33
< addl 4194356(%esp), %eax
---
> addl 4194352(%esp), %eax
并且,这四句汇编在这行的时候不会产生性能差别,那性能差别出现在那里。可定不是循环、计算数据产生的差别。差别会出现在内存的访问位置上吗?不会的,内存是随机访问,访问任何一个位置内存的地址的时间应该是一样的。我们现在考虑一下是不是操作系统的缓存的功能。首先,本程序在加载到内存执行、以后除了cpu访问内存之外没有任何的资源消耗。所以说不是系统的问题。想了很久,想到cpu访问数据的时候是以块进行访问的,将取来的数据放到缓存中。因为a[i][i]是顺序访问,所以cpu缓存中的数据可以直接使用,无需再访问内存。而a[j][i]非顺序访问,下一个访问的位置,不在cpu的缓存中。
提议:在写代码的时候
1. 对数组、结构体进行顺序访问。提高缓存的命中率。
2. 减少不必要的判断,提高cpu的分支预测的命中率
- 在细节上提升你的程序的性能
- 在细节上提升你的程序的性能
- 在细节上提升你的程序的性能
- 在细节上提升你的程序的性能
- 在细节上提升你的程序的性能
- 程序的性能优化之代码上的细节优化
- 有助web系统性能提升的一些细节,作为开发工程师的你注意了吗?
- java 性能优化:35 个小细节,让你提升 java 代码的运行效率
- JAVA性能优化:35个小细节让你提升java代码的运行效率
- java 性能优化:35 个小细节,让你提升 java 代码的运行效率
- “快”在细节 J2EE程序的性能优化技巧
- 提升IBatis的性能的一些小细节
- 为了提升性能,应关注代码的每个细节
- 提升你的Java应用性能
- 让你的程序性能获得百倍的提升—Redis基础使用指南
- 浅谈提升程序性能的方式
- 如果提升PHP程序的性能
- 提升程序性能的一些方法
- 增强视觉效果的几种方法
- 住建部表态继续限购 下一年保证房开工600万套
- assertEFM使用小结
- 黑马程序员_张孝祥—高新技术学习总结(十)
- eclipse 中创建maven web项目
- 在细节上提升你的程序的性能
- Linux vi编辑器的使用
- Sicily.1020. Big Integer
- jsp中page,request,session,application的区别
- WebRTC源码分析2图像缩放与颜色空间转换
- 实现Javascript异步编程的4种方法(转)
- 网页前台分页算法
- WebRTC源码分析3_jpeg编解码
- C#性能分析优化系列文章索引