如何写出高效的单片机C语言程序代码
来源:互联网 发布:单反相机拍摄技巧 知乎 编辑:程序博客网 时间:2024/05/16 01:21
由于单片机的性能同电脑的性能是天渊之别的,无论从空间资源上、内存资源、工作频率,都是无法
与之比较的。PC机编程基本上不用考虑空间的占用、内存的占用的问题,最终目的就是实现功能就可以了。
对于单片机来说就截然不同了,一般的单片机的Flash和Ram 的资源是以KB 来衡量的,可想而知,单片
机的资源是少得可怜,为此我们必须想法设法榨尽其所有资源,将它的性能发挥到最佳,程序设计时必须
遵循以下几点进行优化:
1.使用尽量小的数据类型
能够使用字符型(char)定义的变量,就不要使用整型(int)变量来定义;能够使用整型变量定义的变
量就不要用长整型(longint),能不使用浮点型(float)变量就不要使用浮点型变量。当然,在定义变
量后不要超过变量的作用范围,如果超过变量的范围赋值,C编译器并不报错,但程序运行结果却错了,
而且这样的错误很难发现。
2.使用自加、自减指令
通常使用自加、自减指令和复合赋值表达式(如a-=1及a+=1 等)都能够生成高质量的
程序代码,编译器通常都能够生成inc和dec 之类的指令,而使用a=a+1 或a=a-1 之类
的指令,有很多C编译器都会生成二到三个字节的指令。
3.减少运算的强度
可以使用运算量小但功能相同的表达式替换原来复杂的的表达式。
(1)求余运算
N=N %8 可以改为N = N &7
说明:位操作只需一个指令周期即可完成,而大部分的C编译器的“%”运算均是调用子程序来
完成,代码长、执行速度慢。通常,只要求是求2n方的余数,均可使用位操作的方法来代替。
(2)平方运算
N=Pow(3,2)可以改为N=3*3
说明:在有内置硬件乘法器的单片机中(如51系列),乘法运算比求平方运算快得多, 因为浮点数
的求平方是通过调用子程序来实现的,乘法运算的子程序比平方运算的子程序代码短,执行速度快。
(3)用位移代替乘法除法
N=M*8可以改为N=M<<3
N=M/8可以改为N=M>>3
说明:通常如果需要乘以或除以2n,都可以用移位的方法代替。如果乘以2n,都可以生成左移
的代码,而乘以其它的整数或除以任何数,均调用乘除法子程序。用移位的方法得到代码比调用乘除法子
程序生成的代码效率高。实际上,只要是乘以或除以一个整数,均可以用移位的方法得到结果。如N=M*9
可以改为N=(M<<3)+M;
(4)自加自减的区别
例如我们平时使用的延时函数都是通过采用自加的方式来实现。
voidDelayNms(UINT16 t)
{
UINT16i,j;
for(i=0;i<t;i++)
for(j=0;i<1000;j++)
}
可以改为
voidDelayNms(UINT16 t)
{
UINT16i,j;
for(i=t;i>=0;i--)
for(j=1000;i>=0;j--)
}
说明:两个函数的延时效果相似,但几乎所有的C编译对后一种函数生成的代码均比前一种代码少1~3
个字节,因为几乎所有的MCU均有为0 转移的指令,采用后一种方式能够生成这类指令。
4.while 与do...while 的区别
voidDelayNus(UINT16 t)
{
while(t--)
{
NOP();
}
}
可以改为
voidDelayNus(UINT16 t)
{
do
{
NOP();
}while(--t)
}
说明:使用do…while循环编译后生成的代码的长度短于while 循环。
5.register 关键字
voidUARTPrintfString(INT8 *str)
{
while(*str&& str)
{
UARTSendByte(*str++)
}
}
可以改为
voidUARTPrintfString(INT8 *str)
{
registerINT8 *pstr=str;
while(*pstr&& pstr)
{
UARTSendByte(*pstr++)
}
}
说明:在声明局部变量的时候可以使用register关键字。这就使得编译器把变量放入一个多用途的寄存
器中,而不是在堆栈中,合理使用这种方法可以提高执行速度。函数调用越是频繁,越是可能提高代码的
速度,注意register关键字只是建议编译器而已。
6.volatile 关键字
volatile总是与优化有关,编译器有一种技术叫做数据流分析,分析程序中的变量在哪里赋值、在
哪里使用、在哪里失效,分析结果可以用于常量合并,常量传播等优化,进一步可以死代码消除。一般来
说,volatile关键字只用在以下三种情况:
a)中断服务函数中修改的供其它程序检测的变量需要加volatile(参考本书高级实验程序)
b)多任务环境下各任务间共享的标志应该加volatile
c)存储器映射的硬件寄存器通常也要加volatile 说明,因为每次对它的读写都可能由不同意义
总之,volatile关键字是一种类型修饰符,用它声明的类型变量表示可以被某些编译器未知的因素
更改,比如:操作系统、硬件或者其它线程等。遇到这个关键字声明的变量,编译器对访问该变量的代码
就不再进行优化,从而可以提供对特殊地址的稳定访问。
7.以空间换时间
在数据校验实战当中,CRC16循环冗余校验其实还有一种方法是查表法,通过查表可以更加快获得
校验值,效率更高,当校验数据量大的时候,使用查表法优势更加明显,不过唯一的缺点是占用大量的空
间。
//查表法:
codeUINT16 szCRC16Tbl[256] = {
0x0000,0x1021, 0x2042, 0x3063, 0x4084, 0x50a5, 0x60c6, 0x70e7,
0x8108,0x9129, 0xa14a, 0xb16b, 0xc18c, 0xd1ad, 0xe1ce, 0xf1ef,
0x1231,0x0210, 0x3273, 0x2252, 0x52b5, 0x4294, 0x72f7, 0x62d6,
0x9339,0x8318, 0xb37b, 0xa35a, 0xd3bd, 0xc39c, 0xf3ff, 0xe3de,
0x2462,0x3443, 0x0420, 0x1401, 0x64e6, 0x74c7, 0x44a4, 0x5485,
0xa56a,0xb54b, 0x8528, 0x9509, 0xe5ee, 0xf5cf, 0xc5ac, 0xd58d,
0x3653,0x2672, 0x1611, 0x0630, 0x76d7, 0x66f6, 0x5695, 0x46b4,
0xb75b,0xa77a, 0x9719, 0x8738, 0xf7df, 0xe7fe, 0xd79d, 0xc7bc,
0x48c4,0x58e5, 0x6886, 0x78a7, 0x0840, 0x1861, 0x2802, 0x3823,
0xc9cc,0xd9ed, 0xe98e, 0xf9af, 0x8948, 0x9969, 0xa90a, 0xb92b,
0x5af5,0x4ad4, 0x7ab7, 0x6a96, 0x1a71, 0x0a50, 0x3a33, 0x2a12,
0xdbfd,0xcbdc, 0xfbbf, 0xeb9e, 0x9b79, 0x8b58, 0xbb3b, 0xab1a,
0x6ca6,0x7c87, 0x4ce4, 0x5cc5, 0x2c22, 0x3c03, 0x0c60, 0x1c41,
0xedae,0xfd8f, 0xcdec, 0xddcd, 0xad2a, 0xbd0b, 0x8d68, 0x9d49,
0x7e97,0x6eb6, 0x5ed5, 0x4ef4, 0x3e13, 0x2e32, 0x1e51, 0x0e70,
0xff9f,0xefbe, 0xdfdd, 0xcffc, 0xbf1b, 0xaf3a, 0x9f59, 0x8f78,
0x9188,0x81a9, 0xb1ca, 0xa1eb, 0xd10c, 0xc12d, 0xf14e, 0xe16f,
0x1080,0x00a1, 0x30c2, 0x20e3, 0x5004, 0x4025, 0x7046, 0x6067,
0x83b9,0x9398, 0xa3fb, 0xb3da, 0xc33d, 0xd31c, 0xe37f, 0xf35e,
0x02b1,0x1290, 0x22f3, 0x32d2, 0x4235, 0x5214, 0x6277, 0x7256,
0xb5ea,0xa5cb, 0x95a8, 0x8589, 0xf56e, 0xe54f, 0xd52c, 0xc50d,
0x34e2,0x24c3, 0x14a0, 0x0481, 0x7466, 0x6447, 0x5424, 0x4405,
0xa7db,0xb7fa, 0x8799, 0x97b8, 0xe75f, 0xf77e, 0xc71d, 0xd73c,
0x26d3,0x36f2, 0x0691, 0x16b0, 0x6657, 0x7676, 0x4615, 0x5634,
0xd94c,0xc96d,
与之比较的。PC
对于单片机来说就截然不同了,一般的单片机的Flash
机的资源是少得可怜,为此我们必须想法设法榨尽其所有资源,将它的性能发挥到最佳,程序设计时必须
遵循以下几点进行优化:
1.
能够使用字符型(char)定义的变量,就不要使用整型(int)变量来定义;能够使用整型变量定义的变
量就不要用长整型(long
量后不要超过变量的作用范围,如果超过变量的范围赋值,C
而且这样的错误很难发现。
2.
通常使用自加、自减指令和复合赋值表达式(如a-=1
程序代码,编译器通常都能够生成inc
的指令,有很多C
3.
可以使用运算量小但功能相同的表达式替换原来复杂的的表达式。
(1)
N=
说明:位操作只需一个指令周期即可完成,而大部分的C
完成,代码长、执行速度慢。通常,只要求是求2n
(2)
N=Pow(3,2)
说明:在有内置硬件乘法器的单片机中(如51
的求平方是通过调用子程序来实现的,乘法运算的子程序比平方运算的子程序代码短,执行速度快。
(3)
N=M*8
N=M/8
说明:通常如果需要乘以或除以2n,都可以用移位的方法代替。如果乘以2n,都可以生成左移
的代码,而乘以其它的整数或除以任何数,均调用乘除法子程序。用移位的方法得到代码比调用乘除法子
程序生成的代码效率高。实际上,只要是乘以或除以一个整数,均可以用移位的方法得到结果。如N=M*9
可以改为N=(M<<3)+M;
(4)
例如我们平时使用的延时函数都是通过采用自加的方式来实现。
void
{
UINT16
for(i=0;i<t;i++)
for(j=0;i<1000;j++)
}
可以改为
void
{
UINT16
for(i=t;i>=0;i--)
for(j=1000;i>=0;j--)
}
说明:两个函数的延时效果相似,但几乎所有的C
个字节,因为几乎所有的MCU
4.
void
{
while(t--)
{
NOP();
}
}
可以改为
void
{
do
{
NOP();
}while(--t)
}
说明:使用do…while
5.
void
{
while(*str
{
UARTSendByte(*str++)
}
}
可以改为
void
{
register
while(*pstr
{
UARTSendByte(*pstr++)
}
}
说明:在声明局部变量的时候可以使用register
器中,而不是在堆栈中,合理使用这种方法可以提高执行速度。函数调用越是频繁,越是可能提高代码的
速度,注意register
6.
volatile
哪里使用、在哪里失效,分析结果可以用于常量合并,常量传播等优化,进一步可以死代码消除。一般来
说,volatile
a)
b)
c)
总之,volatile
更改,比如:操作系统、硬件或者其它线程等。遇到这个关键字声明的变量,编译器对访问该变量的代码
就不再进行优化,从而可以提供对特殊地址的稳定访问。
7.
在数据校验实战当中,CRC16
校验值,效率更高,当校验数据量大的时候,使用查表法优势更加明显,不过唯一的缺点是占用大量的空
间。
//查表法:
code
0x0000,
0x8108,
0x1231,
0x9339,
0x2462,
0xa56a,
0x3653,
0xb75b,
0x48c4,
0xc9cc,
0x5af5,
0xdbfd,
0x6ca6,
0xedae,
0x7e97,
0xff9f,
0x9188,
0x1080,
0x83b9,
0x02b1,
0xb5ea,
0x34e2,
0xa7db,
0x26d3,
0xd94c,