C/C++与汇编的函数相互调用分析
来源:互联网 发布:美篇同类软件 编辑:程序博客网 时间:2024/06/01 08:30
转自:http://blog.sina.com.cn/s/blog_4ae178ba01012d3o.html
C/C++与汇编的函数相互调用分析
write by 九天雁翎(JTianLing) -- blog.csdn.net/vagrxie
讨论新闻组及相关文件下载
昨天好好研究了一下内嵌汇编的情况。。。。。更进一步的,该是看看独立编译的汇编程序与C/C++互相调用的情况了。
呵呵,最近怎么好像老在搞这个,想当年学习的时候,一门心思的学C++,到现在老是在弄诸如怎么在C/C++中调用LUA函数,或者反过来,怎么C/C++中调用Python函数,或者反过来,今天又是怎么在C/C++中调用汇编的函数,或者反过来。。。。。。。。。。。。。呵呵,自从学习的语言越来越多,类似的情况碰到的也就越来越多了,但是,只懂一门语言就不能在合适的时候使用合适的语言来解决问题,并且看问题会带有狭隘的偏见,谁说的来着?毕竟无论是lua,python,asm都会有用的上的时候,我最近似乎老是喜欢说闲话。。。。这是某些哥们说的自己的见解,还是某些时候无聊的牢骚呢?谁知道呢,过年了嘛,还不让人多说几句话啊。。。。。。-_-!
首先来看
C中调用汇编的函数
先添加一个汇编文件写的函数吧,在VS2005中对此有了明显的进步,因为就《加密与解密》一书描述,在2003中需要自己配置编译选项,但是在VS2005中很明显的,当你添加asm文件后,可以自己选定masm的编译规则,然后一切就由IDE把你做好了,这也算是IDE的一个好用的地方吧。。。。
非常不好的一点就是,VS2005中对于汇编没有任何语法高亮。。。。damnit!IDE怎么做的?就这点而言,其甚至不如一般的文本编辑工具!。。。又是废话了。。
因为是C,这个目前全世界可能是最具有可移植性的语言,所以问题要简单的多。但是。。。也不全是那么简单,先看看直觉的写法:
汇编代码:
PUBLIC GetArgument
.486
.model flat
;option casemap :none
_TEXT SEGMENT PUBLIC 'CODE'
GetArgument PROC
GetArgument ENDP
_TEXT ENDS
END
C语言代码:
#include <stdio.h>
#include <windows.h>
int GetArgument(int);
int _tmain(int argc, _TCHAR* argv[])
{
}
声明是必不可少的,毕竟汇编没有头文件给你包含,不过多的话,可以考虑组织一个专门用于包含汇编函数实现的头文件。但是在编译时却不会通过。
1>InlineAsm.obj : error LNK2001: 无法解析的外部符号_GetArgument
1>
看到错误原因也知道是怎么回事了,C中的函数名被编译器处理时多了个前置的下划线,当然,这个问题好解决。
一种方式是改变汇编代码的函数,直接添加一个前置下划线就完了,一种方式是将其声明为C语言的方式,那么链接程序也知道正确的链接了。两种方式分别如下:
直接改变函数名:
PUBLIC _GetArgument
.486
.model flat
;option casemap :none
_TEXT SEGMENT PUBLIC 'CODE'
_GetArgument PROC
_GetArgument ENDP
_TEXT ENDS
END
改变.model声明:
PUBLIC GetArgument
.486
.model flat,c
;option casemap :none
_TEXT SEGMENT PUBLIC 'CODE'
GetArgument PROC
GetArgument ENDP
_TEXT ENDS
END
个人推荐第2种方式,因为看起来最舒服,将改变函数名的工作交给编译和链接程序吧。
假如是在C++中调用ASM函数的话,相对复杂一点,因为没有.model C++的生命方式。。。这个世界是不公平对待C和C++的。。。。呵呵,但是C++有完整的向C靠拢的机制,这就够了。
汇编代码不变,C++调用时用如下形式:
#include <stdio.h>
#include <windows.h>
extern "C" int _cdecl GetArgument(int);
int _tmain(int argc, _TCHAR* argv[])
{
}
即将C++函数完整的声明为C语言的形式。。。。。但是我在MSDN中看到了.model起码有stdcall的声明方式,有这种声明方式为什么不用呢?呵呵,用一下。
将汇编语言的.model声明改成下面这样:
.model flat,c,stdcall
C++中函数声明为下面这样:
extern "C" int __stdcall GetArgument(int);
结果却是链接错误:
1>
当我自以为声明一致时,却不知道发生了什么,假如是以前,我可能得一筹莫展。。。但是现在嘛。。。。既然知道obj文件其实也是可读的,那么,看看链接的时候出了什么问题,为什么汇编出来的obj文件中没有这个符号呢?可以在obj文件的最后一行看到答案:
原来汇编的代码声明stdcall后函数符号被解析成_GetArgument@0了,那不是表示没有参数吗?看来是我汇编写错了。
改成如下形式:
PUBLIC GetArgument
.486
.model flat,c,stdcall
;option casemap :none
_TEXT SEGMENT PUBLIC 'CODE'
GetArgument PROC x:DWORD
GetArgument ENDP
_TEXT ENDS
END
然后再运行程序,崩溃。。。。。。
看看原因:
GetArgument PROC x:DWORD
00401030
00401031
00401033
00401036
很明显汇编编译后自动加了push
GetArgument PROC x:DWORD
RETN 4
但 是这样做个人感觉实在是太不优美了。。。。。。。奇怪的是编译器为什么要这样解析代码。。。。呵呵,即便你是用汇编。。。特别是伪汇编。。。你都会发现编 译器在你的背后动了太多手脚,很多,是你根本不想要它去做的。这一点也可能是我汇编代码声明或写的有问题,导致编译器奇怪的处理了,有知道正确结果的高人 请指点一下.
下面,在汇编中调用C/C++函数:
在此不分辨C和C++了,差别仅在于一个extern “C”而已,调用约定采用__stdcall其他请参考
汇编代码如下:
PUBLIC GetArgument2
.486
.model flat,stdcall
;option casemap :none
GetArgument PROTO
_TEXT SEGMENT PUBLIC 'CODE'
GetArgument2 PROC x:DWORD
GetArgument2 ENDP
_TEXT ENDS
END
C++代码:
#include <stdio.h>
#include <windows.h>
extern "C" int __stdcall GetArgument(int ai)
{
}
extern "C" int __stdcall GetArgument2(int ai);
int _tmain(int argc, _TCHAR* argv[])
{
}
至此,你会高兴的发现,一个10,从C++中调用汇编的函数GetArgument2,再从汇编中调用C++的函数GetArgument再返回,得到正确结果。。。真不容易啊。。。这例子举得真够折腾的:)呵呵,说明问题就好了。最重要的一句就在于GetArgument PROTO
初看这个标题,也许很多读者会认为很深奥!有这种想法就错了,其实无论是C调用汇
编还是汇编调用C,都没有想象中的那么复杂。上一节1_4例中的delay_nms函数,只要把
delay_nms改为_delay_nms就可以不做其它任何修改而被C函数调用了。是不是很简单?
^_^
之所以要做这样修改,是因为C51的函数转换为汇编的时候,函数名根据实际情况有可
能会改动,这种改动是很有规律而且简单的,只要记下来就行。看下表
--------------------+---------+-------------------------------------
声明
--------------------+---------+-------------------------------------
void func(void)...
|
void func1(char)... | _FUNC1
|
|
void func2(void)
reentrant...
--------------------+---------+-------------------------------------
因为我们的delay_nms函数是通过寄存器传递参数的,根据第二条,自然要在前面加
一个下划线了'_'。
先来看看例子吧,例2-1
#i nclude <reg51.h>
#i nclude "2_1_delay.h"
#define
#define
sbit LED_IO = P1^0;
#define led_op(op) do { \
LED_IO = op; \
}while(0)
void main(void)
{
while(1) {
led_op(LED_ON);
delay_nms(200);
led_op(LED_OFF);
delay_nms(500);
}
}
;;;
;; file
;; author yanfeng <szq106@163.com>
;; date
;;
;; update <Sat Feb 10 17:14:00 2007>
;;
;; brief
;;
;;
;;
;
;;; code
delay_nms_seg segment code
delay_1ms_seg segment code
public _delay_nms
delay_nms_data segment data
rseg delay_nms_data
delay_reg:
rseg delay_nms_seg
_delay_nms:
mov a, r6
mov delay_reg, a
mov a, r7
mov delay_reg+1, a
delay_nms_1:
lcall delay_1ms
djnz
mov
jz
dec
sjmp
delay_nms_ret:
ret
rseg delay_1ms_seg
delay_1ms:
mov r0, #250
delay_200ms_1:
nop
nop
djnz r0, delay_200ms_1
ret
end
;
;;; end
;;; Local variables:
;;; outline-regexp: ";; @+"
;;; eval: (outline-minor-mode 1)
;;; End:
;;; 2_1_delay.asm ends here
#ifndef _2_1_DELAY_H
#define _2_1_DELAY_H
extern void delay_nms(unsigned int dly);
#endif
注意到这里增加了一个2_1_delay.h的头文件,是的,因为delay_nms函数是被C函数
调用,提供的接口当然也只能是C语言形式的。
C函数调用汇编函数如此的简单,那汇编函数调用C函数是否就会复杂呢?答案是肯定
的,在1-4例中完全可以把delay_nms及delay_1ms函数用C来实现而保持start函数的汇编形
式。
在实现这个例子之前,先来讨论一些理论的知识,只有充分掌握了知识,才能更好的
完成C函数及汇编函数的相互调用。
正常的,定义一个函数总是希望它完成某些功能,一个毫无用处的函数将毫无意义。
这些功能有常常是更大的功能的一部分,而函数完成这些功能或多或少都要与外界联系
(一个完全不与外界联系的函数也是一个毫无意义的函数)(延时函数也要消耗时间,时
间也属于外界的一种资源),比如要传递一些数据给其处理,处理过后返回处理的结果。
这种数据的传递可以形象的通过两种方式来实现,一种是外界直接把数据给函数,另一种
是函数自己去外界取数据。
先来说第一种,外界直接把数据给函数,这就像您订牛奶,每天早上牛奶工人都固定
把牛奶送到您家的门口,早上起来之后,您只要开门就可取牛奶了,而不需要考虑是谁送
来的。吃完之后,把瓶放回门口,也不用考虑牛奶工人什么时候取走。您跟牛奶公司就通
过您家的门口来联系,您不需要考虑牛奶公司到底在哪里。牛奶公司也不需要知道您家几
口人。^_^!这就是通过参数及返回值来实现的函数的例子。这种方式接口简单,函数不
需要知道外界是谁调用了它,外界也不用知道函数的实现细节。函数很容易实现重入。
再来说第二种,函数自己去外界取数据,这就相当于您知道牛奶店在XX街yy号,每天
早上要喝牛奶,自己就要屁颠屁颠跑到XX街yy号去买,到了店里,有人比您早正在前面买
那(资源占用),咋办?排队呗(等待资源释放)!不行,这队伍也太长了吧。您也抢到
最前面去买,正在买的伙计可不会让您。这下好了,吵起来了(资源竞争)!两家伙吵吵
嚷嚷,牛奶店一时也卖不了牛奶了(资源破坏)。老半天之后,您终于买到了牛奶回家,
喝完之后,又把奶瓶送回店里。这就是通过全局变量来传递数据的函数实现方式(也许应
该叫过程)。这种方式易破坏数据,不具备可重入性。(想起basic了)。
无论那一种模型,都需要有一个地方(及数据存储区)给其传入数,对于第一种模型
来说,大多是通过栈来实现,这是隐性的方式,即调用者并不需要知道这个数据区在哪里。
而第二种模型,就必须开辟一个公共的区域,调用者及被调用者都必须能访问此区域。
由于51的特殊性,堆栈空间很小,进出栈开销大,要实现第一种模型是比较困难的,
因此Keil并没有采用此方法,但是为了函数的可重入性,仍实现了模拟栈,函数可以通过
模拟栈传递参数,但是通过模拟栈来传递参数的开销更大。因此不是特别必要不建议使用。
(由于很多库函数都是可重入的,因此模拟栈还是有必要了解一下,这将在下节介绍。)
正常的C函数,keil就是通过固定数据区来传递参数的,即第二种模型,因此如下两
个函数,在keil c51的环境本质上没有任何区别。
void delay1(int del)
{
while(del);
}
int del;
void delay2(void)
{
while(del);
}
也许读者会怀疑,下面的del是全局,的任何函数都可以访问,而上一个函数的参数
却是局部的,外部函数不能访问。而且调用上也不一样啊,调用delay1直接delay1(200)
就可以了,调用delay2写法上就有诸多不同,del = 200; delay2()。
这就多虑了,delay1的参数del是通过固定数据区传递的,也就是del分配在固定的地
址,如果其它函数不能访问,那其它函数怎么调用delay1函数呢?只不过keil C51编译的
时候把参数del(具体来说应该是参数段)换了一个名而已。至于调用的问题,C51编译的
函数都会在最前面加入一些代码把具体的实参copy到参数区。
了解了这些,下面来看看C51函数的具体传递规则,这些规则在上一节已经有初步的提
及,但是并没有深入。
C51有三种参数传递的方法:
1,通过寄存器传递。(缺省)
2,通过固定存储区传递。
3,通过模拟栈传递。
1,2属于第二种模型,通过寄存器传递的方法只是一种特例,为了加快参数的传递。
在固定存储区仍会为参数分配空间,有时候为了优化,参数区就分配在了寄存器区里
(r0-r7)。 3,前面提及属于第一种模型。
缺省的,C函数在寄存器中最多传递三个参数。余下的参数通过固定存储区传递。可以
用NOREGPARMS命令取消用寄存器传递参数。如果用寄存器传递参数取消,或参数太多,参
数通过固定存储区传递。用寄存器传递参数的函数在生成代码时被Cx51编译器在函数名前
加了一个下划线'_' 的前缀。只在固定存储区传递参数的函数没有下划。
下表定义用来传递参数的寄存器。
--------+----------------+---------------|------------|------------------
参数数目| char,1字节指针 | int,2字节指针 | long,float | 通用指针
--------+----------------+---------------|------------|------------------
1
|
2
3
--------+----------------+---------------|------------|------------------
对于参数通过固定存储区传递的函数,那么调用函数是如何知道被调用函数的参数区
呢?如果没有一个统一通用的办法,那么编译的实现将很困难,因此Keil c51是使用可重
入段的方法。 参数用段名 ?function_name?BYTE和?function_name?BIT 保存传递给函数
function_name的参数。位参数在调用函数前复制到?function_name?BIT段。别的参数复制
到?function_name?BYTE段。即使通过寄存器传递参数,在这些段中也给所有的参数分配空
间。参数按每个段中的声明的顺序保存。这个段些对其它函数来说是可见的,因此其它函
数就能通过这些段传递参数并调用函数了。而这些段的命名都有统一的格式,依赖与函数
名,因为不允许函数重名,因此这些段名也是唯一的。
段名的定义:
?function_name?BYTE
?function_name?BIT
函数返回值
函数返回值通常用CPU寄存器传递。下表列出了可能的返回值和所用的寄存器。
--------------------+--------+---------------------------------
返回类型
--------------------+--------+---------------------------------
bit