实现通用化DLL调用模块的设计解析

来源:互联网 发布:linux口令长度 编辑:程序博客网 时间:2024/06/06 04:15

实现通用化DLL调用模块的设计解析

注:本文为原创,请勿转载

前言

一般在windows下使用C++调用dll的常见方式有:

  • 静态调用 – 通过.h+.lib的方式实现

  • 动态调用 – 通过函数声明+GetProcessAddress的方式实现

上述两种方式非常常见,也能够实现绝大多数的功能需求,两者的共性都是需要有函数声明(.h文件)才能去调用DLL中的函数。从本质上来说,上述方案都需要提供函数声明信息来支持C++编译器的静态编译过程。

但是,有些需求是无法在编译时就能确定函数声明信息的,例如需求是实现一种解释脚本及脚本解析器,其功能需求之一是需要能够动态执行外部的dll的函数。也就是说需要在程序实时运行过程中来动态确定函数的参数及参数类型、参数数量、函数的返回值及类型。

要实现这样的解释脚本解析器,上述静态调用和动态调用的静态声明+静态编译的方式基本上是行不通的,我们需要能够实现“动态声明”+”动态编译”的方案。

而“动态声明”+”动态编译”的解决方案,也正是本文讨论的内容。

阅读本文需要具备如下基础知识和技能:

  • C++11语法知识(及以上)
  • windows平台API使用&开发常识
  • WindowsDll开发常识
  • VisualStudio2015使用
  • VisualStudio2015 x86inline_asm和x64inline_asm的使用
  • 汇编语言基础知识
  • 动态调用 – 通过函数声明+GetProcessAddress的方式实现

我的最终设计目标是:开发出一个跨平台的库函数调用器,本文主要讲Windows x64部分。x86部分的设计可以参考该文章:在无函数声明的情况下运行时动态调用DLL函数。


工作环境选择

我个人比较愿意接受新事物,以往都工作于Linux下,经综合考虑之后,在Windows下开发环境选择如下:

项目 内容 备注 Windows版本 Win10 x64专业版 追赶潮流 开发工具 VisualStdio2015 C++11&14 C++编译器 VC C++ 14 理由是在Windows asm编译器 VS2015自带的masm (ml64) 理由是在Windows 构建工具 nmake 理由是在Windows

msvc在编译为x86时支持内联汇编,但在编译为x64时只支持.asm文件。也就是说x86和x64在汇编部分的实现是完全不同的。
ml64很多伪指令不支持,典型的比如invoke、.if 、.elseif 等等 。
如果汇编部分考虑跨平台,则应该使用icc或gcc编译器,同时汇编语法也需要改用at&t,因为msvc的汇编语法为inter

基础知识精炼

函数调用约定

特别注意:x86和x64下的函数调用约定存在非常大的区别!!

x86下的调用约定列表

约定类型 内容 __stdcall 参数从右到左入栈 ,调用的API负责栈指针(ESP)的恢复 __cdecl 参数从右到左入栈,API的调用者负责栈指针(ESP)的恢复 *__fastcall Pascal ,参数入栈顺序时自左向右 _thiscall 面向对象时使用

__fastcall和__thiscall都不在本文考虑范围内。

x64下的调用约定列表

约定类型 备注 __stdcall 参数从右到左入栈,API的调用者负责栈空间(RSP)的分配与回收 __cdecl 参数从右到左入栈,API的调用者负责栈空间(RSP)的分配与回收

可以看到,与x86不同,在x64下__stdcall和__cdecl没什么差别。

C++函数调用

在C++中调用DLL中的函数和调用当前项目中的函数没有区别,都需要如下基础信息:
目标函数的地址
目标函数参数类型、数量
目标函数返回值

在整个实现过程中我都是用当前项目中的函数进行调试,成功后才使用DLL验证以下,所有测试用例也基于本地函数。 —— [ 维基百科 ]

asm函数调用

实现本文的需求时,对汇编要求并不高,x86下将所有数据视为dword;x64下直接将所有数据视为qword.

x86

在32位汇编中,我们调用一个API时,如果采用的是stdcall,它有两个特点:一是所有参数入栈,通过椎栈传递;二是被调用的API负责栈指针(ESP)的恢复。但如果采用cdecl,则由API的调用者负责堆栈指针的恢复。

x64

x64首先把x86原有的寄存器扩展到了64位,然后更增加了8个通用寄存器:R8~~R15,增加了8个128位XMM寄存器。
win64 ABI对于调用约定就是这样规定的,优先用寄存器传递前4个参数,但是栈上还是分配参数空间(32 个字节,前4 个参数的 64 位值)。该空间允许将传入函数的寄存器轻松地复制到已知的堆栈位置。不要求被调用函数将输入寄存器参数溢出至堆栈,但需要时,堆栈空间预留确保它可以这样做。当然,如果要传递 4 个以上的整数参数,则必须预留相应的额外堆栈空间。

在x64汇编中,两方面都发生了变化。一是前四个参数分析通过四个寄存器传递:RCX、RDX、R8、R9,如果还有更多的参数,才通过椎栈传递。二是调用者负责椎栈空间的分配与回收。

需要注意的是:

  • 函数前四个整型参数分析通过四个寄存器传递:RCX、RDX、R8、R9
  • 函数前四个float、double型参数分析通过四个寄存器传递:xmm0、xmm1、xmm2、xmm3
  • 还有更多的参数,才通过椎栈传递
  • 返回值也通过椎栈传递(RSP),该空间需要与输入参数一样预先分配

1、x64上面默认的函数调用约定是fast call,也就是ABI是fast call。
2.、前四个参数传递顺序是RCX,RDX,R8,R9,其余的参数通过压栈传递。注意这里有一个细节:前四个参数也是占用栈空间的,或者说,栈需要为前四个参数保留32个字节。
3、小于64位的参数传递时高位并不填充零,大于64位需要按照地址传递。
4、返回值在RAX
5、RAX,RCX,RDX,R8,R9,R10,R11是“易挥发”的,其余寄存器需要保护。
6、win64 ABI要求除了叶子函数(不再调用任何其他函数的函数)外,保证进入/退出函数时堆栈指针16-byte对齐

堆栈平衡时RSP的公式为:n*8+1,对该结果再进行一次16-byte平衡(16-byte对其,形如30h,40h,50h,绝不会出现28h)。

例如:当被掉函数的参数数量n<=4时进行堆栈平衡时RSP的一般修改值为:30h。这是为什么?4个默认参数分配+1个返回值不是应该在堆栈上分配28h么?
答案是:这里需要进行堆栈对齐,而x64下的堆栈对齐是16-byte的,所以是30h。

x64下的调用范例:

testFun_float_stdcall(1, 2,3.0f,4.0,5,6.0,7.0f);movss       xmm0,dword ptr [__real@40e00000 (07FF7396F0C18h)]  movss       dword ptr [rsp+30h],xmm0  movsd       xmm0,mmword ptr [__real@4018000000000000 (07FF7396F0C10h)]  movsd       mmword ptr [rsp+28h],xmm0  mov         dword ptr [rsp+20h],5  movsd       xmm3,mmword ptr [__real@4010000000000000 (07FF7396F0E80h)]  movss       xmm2,dword ptr [__real@40400000 (07FF7396F0E78h)]  mov         edx,2  mov         ecx,1  call        testFun_float_stdcall (07FF7396E173Ah)  

本编辑器支持 Markdown Extra ,  扩展了很多好用的功能。具体请参考Github.

表格

Markdown Extra 表格语法:

项目 价格 Computer $1600 Phone $12 Pipe $1

可以使用冒号来定义对齐方式:

项目 价格 数量 Computer 1600 元 5 Phone 12 元 12 Pipe 1 元 234

定义列表

Markdown Extra 定义列表语法:
项目1
项目2
定义 A
定义 B
项目3
定义 C

定义 D

定义D内容

代码块

代码块语法遵循标准markdown代码,例如:

@requires_authorizationdef somefunc(param1='', param2=0):    '''A docstring'''    if param1 > param2: # interesting        print 'Greater'    return (param2 - param1 + 1) or Noneclass SomeClass:    pass>>> message = '''interpreter... prompt'''

脚注

生成一个脚注1.

目录

[TOC]来生成目录:

  • 实现通用化DLL调用模块的设计解析
    • 前言
    • 工作环境选择
    • 基础知识精炼
      • 函数调用约定
        • x86下的调用约定列表
        • x64下的调用约定列表
      • C函数调用
      • asm函数调用
        • x86
        • x64
      • 表格
      • 定义列表
      • 代码块
      • 脚注
      • 目录
      • 数学公式
      • UML 图
    • 离线写博客
    • 浏览器兼容

数学公式

使用MathJax渲染LaTex 数学公式,详见math.stackexchange.com.

  • 行内公式,数学公式为:Γ(n)=(n1)!nN
  • 块级公式:

x=b±b24ac2a

更多LaTex语法请参考 这儿.

UML 图:

可以渲染序列图:

Created with Raphaël 2.1.0张三张三李四李四嘿,小四儿, 写博客了没?李四愣了一下,说:忙得吐血,哪有时间写。

或者流程图:

Created with Raphaël 2.1.0开始我的操作确认?结束yesno
  • 关于 序列图 语法,参考 [这儿][4],
  • 关于 流程图 语法,参考 [这儿][5].

离线写博客

即使用户在没有网络的情况下,也可以通过本编辑器离线写博客(直接在曾经使用过的浏览器中输入write.blog.csdn.net/mdeditor即可。Markdown编辑器使用浏览器离线存储将内容保存在本地。

用户写博客的过程中,内容实时保存在浏览器缓存中,在用户关闭浏览器或者其它异常情况下,内容不会丢失。用户再次打开浏览器时,会显示上次用户正在编辑的没有发表的内容。

博客发表后,本地缓存将被删除。 

用户可以选择 把正在写的博客保存到服务器草稿箱,即使换浏览器或者清除缓存,内容也不会丢失。

注意:虽然浏览器存储大部分时候都比较可靠,但为了您的数据安全,在联网后,请务必及时发表或者保存到服务器草稿箱

浏览器兼容

  1. 目前,本编辑器对Chrome浏览器支持最为完整。建议大家使用较新版本的Chrome。
  2. IE9以下不支持
  3. IE9,10,11存在以下问题
    1. 不支持离线功能
    2. IE9不支持文件导入导出
    3. IE10不支持拖拽文件导入


  1. 这里是 脚注内容. ↩
原创粉丝点击