截取系统 API 调用

在很多情况下,为了测试代码或扩展操作系统的功能,软件开发人员或测试人员必须截取系统函数调用。有一些软件包能够提供该功能,如微软公司的 Detours* 库,或 OK Thinking Software 的 Syringe*。但是从另一个角度而言,开发人员可能希望不需借助第三方软件,自己就能实现该功能。本文描述了函数截取的几种不同方式,并详细介绍了无需使用商业软件包,也不需受 GNU*(通用公共许可证)许可的约束,就能够实现该功能的一种通用方法。本文所有材料由英特尔公司开发,或根据 MSDN* 样本代码修改而来。
大部分截取任意函数调用的方法都是准备一个 DLL,用来替代将被截取的目标函数,然后将 DLL 注入至目标进程;在与目标进程连接的基础上,DLL 将自己与目标函数相连。这种技术之所以适合此任务,是因为在大多数情况下我们无法获得目标应用程序的源代码,而这种技术只需相对简单地编写一个包含代换函数的 DLL,就可将其与软件的其它部分分离开来。两种截取方法已经过研究和分析。Syringe 通过修改函数输入条目(thunking 表)运行。而Detours 库则直接修改目标函数(在目标进程空间内),并无条件地跳转至代换函数。此外,它还提供能够调用原始函数的 trampoline 函数。Detours 技术之所以采用后一种方法,是因为在许多情况下,Syringe 无法找到 thunk,并且它不能提供 trampoline功能来调用原始函数。在这两种方法下,注入 DLL 的工作方式相同。截取系统函数调用的全部工作流程如下所示:
DLL 注入 — 首先,主软件打开目标进程,并使其加载包含代换函数的 DLL目标函数修改 — 当 DLL 连接至进程时,它在目标进程空间内修改目标函数,从而直接跳转至 DLL 中的代换函数。Trampoline 函数能够随意调用原始函数。目标函数截取 — 当调用目标函数时,它直接跳转至 DLL 中的代换函数。如果开发人员希望调用原始的功能,则他或她就可以调用 trampoline 函数。
DLL 注入
本节内容完全以 MSDN 文章“定制调试诊断工具和实用程序 — 摆脱 DLL“地狱”  (DLL Hell)*”为基础,该文章还包括可下载的源代码。在本文附录中可获得 Inject.cppInject.h 。已对它们进行了定制以便于集成——仅需将其包括在项目中然后调用 InjectLib 即可。使目标进程加载 DLL 的算法按如下步骤工作:
通过调用 OpenProcess 打开目标进程。通过调用 VirtualAllocEx 在目标进程中分配内存。利用 WriteProcessMemory 将要被注入的 DLL 名称写入分配的内存。通过调用 GetProcAddress(GetModuleHandle(TEXT("Kernel32")), "LoadLibraryW") 来获取 LoadLibrary 的地址;调用 CreateRemoteThread,指定 LoadLibrary 的入口点,并将 DLL (第 2 步中) 的名称作为其自变量。目标进程将加载 DLL利用 VirtualFreeEx 释放分配的内存。已不再需要该内存。
Inject.cpp 融合了包括稳固的安全特性等大量其它功能,但上述步骤已足够阐明其核心概念。
目标函数修改为自我修改代码,尽管在将 jmp 注入进程内存的过程中存在一些缺陷,但它在 MSDN*  上具有完善的文件证明。为避免混淆,本节列出了几乎全部的样本代码。目标函数修改的两个主要方面为代换函数和 trampoline 函数。下面的代码片断为截取 GetSystemPowerStatus API 的 DLL 示例:
这段代码为连接所做的第一件事就是调用 InterceptAPI。需要使用包含目标函数的模块名称、目标函数的名称以及代换函数的地址。 GetSystemPowerStatus 位于 kernel32.dll 中。其它基本的 Win32* API,如 MessageBoxPeekMessage,都能够在 user32.dll 中获得。MSDN 指定每个 API 所属的模块;未来的增强版中,将自动为给定的 API 找到正确的模块。InterceptAPI 将目标函数的前五个字节覆盖为无条件跳转(opcode 0xE9),后面为四个字节的带符号整数(向代换函数的位移)。位移从下一个指令开始;因此需要使用 pbReplaced - (pbTargetCode +4)。进行该代码操作时,需要注意以下两点:
将区域覆盖的保护模式改为 VirtualProtect。否则,将发生非法访问错误。必须使用 FlushInstructionCache 来支持指令已存在于高速缓存中的情况。否则,即使内存中的指令已经有所变化,旧代码仍将在高速缓存中运行。
现在,当调用 GetSystemPowerStatus 函数时,它跳转至代换函数,然后直接返回调用方,成功截取调用。
Trampoline 函数
在很多情况下,代换函数除使用自身代码外,还需调用原始目标函数,这样就能够扩展 API 的功能,而不是替换整个 API。Trampoline 函数可以提供该功能。Trampoline 函数的原理如下所示:
编写一个具有相同声明的哑元函数(dummy function),将作为 trampoline 使用。确保哑元函数的长度超过 10 个字节。在覆盖目标函数的前五个字节之前,将它们复制到 trampoline 函数的起始处。利用无条件跳转,将trampoline的第六个字节覆盖为目标函数的第六个字节。与之前一样覆盖目标函数。当从代换函数或其它地方调用 trampoline 函数时,它执行复制出的原始代码的前五个字节,然后跳转至实际原始代码的第六个字节。控制返回至 trampoline 的调用方。当完成其它任务时,控制返回至 API 的控制方。
可能存在一种复杂的情况,即原始代码的第六个字节可能是先前指令的一部分。在这种情况下,函数会覆盖部分先前指令,然后崩溃。在 GetSystemPowerStatus 的情况中,前五个字节后的新指令开始于第七个字节。因此,对于这种工作机制,需要将六个字节复制到 trampoline,并且代码必须相应地调整这个偏移量。代码需要复制的字节数取决于 API。查看原始目标代码(利用调试器或反汇编器)并计算需要复制的字节数是非常必要的。未来的增强版将自动检测正确的偏移量。假设我们已经知道正确的偏移量,下面的代码则显示出可建立 trampoline 函数的可扩展 InterceptAPI 函数:
 1 BOOL InterceptAPI(HMODULE hLocalModule, const char* c_szDllName, const char* c_szApiName, 2         DWORD dwReplaced, DWORD dwTrampoline, int offset) 3 { 4     int i; 5     DWORD dwOldProtect; 6         DWORD dwAddressToIntercept = (DWORD)GetProcAddress( 7             GetModuleHandle((char*)c_szDllName), (char*)c_szApiName); 8  9     BYTE *pbTargetCode = (BYTE *) dwAddressToIntercept;10     BYTE *pbReplaced = (BYTE *) dwReplaced;11     BYTE *pbTrampoline = (BYTE *) dwTrampoline;12 13     // Change the protection of the trampoline region14     // so that we can overwrite the first 5 + offset bytes.15     VirtualProtect((void *) dwTrampoline, 5+offset, PAGE_WRITECOPY, &dwOldProtect);16     for (i=0;i<offset;i++)17         *pbTrampoline++ = *pbTargetCode++;18     pbTargetCode = (BYTE *) dwAddressToIntercept;19 20     // Insert unconditional jump in the trampoline.21     *pbTrampoline++ = 0xE9;        // jump rel3222     *((signed int *)(pbTrampoline)) = (pbTargetCode+offset) - (pbTrampoline + 4);23     VirtualProtect((void *) dwTrampoline, 5+offset, PAGE_EXECUTE, &dwOldProtect);24     25     // Overwrite the first 5 bytes of the target function26     VirtualProtect((void *) dwAddressToIntercept, 5, PAGE_WRITECOPY, &dwOldProtect);27     *pbTargetCode++ = 0xE9;        // jump rel3228     *((signed int *)(pbTargetCode)) = pbReplaced - (pbTargetCode +4);29     VirtualProtect((void *) dwAddressToIntercept, 5, PAGE_EXECUTE, &dwOldProtect);30     31     // Flush the instruction cache to make sure 32     // the modified code is executed.33     FlushInstructionCache(GetCurrentProcess(), NULL, NULL);34     return TRUE;35 }36 
本文描述了截取系统函数调用的一种通用方法,同时还提供了 trampoline 函数,从而保留了原始功能。本文仅对方法进行简要描述,并未对完整的软件包作出说明,因此如下一些细节并没有实现:
自动检测包含目标 API 的模块。自动检测 trampoline 函数的偏移量。删除代换函数,并注入 DLL。(到目前为止,清空代换函数的唯一方法是关闭应用程序。
  1 #include "stdafx.h"  2 #include "Inject.h"  3   4 #include <tchar.h>  5 #include <malloc.h>    // For alloca  6 #include <pi.h>  7   8 #ifdef UNICODE  9 #define InjectLib InjectLibW 10 #else 11 #define InjectLib InjectLibA 12 #endif   // !UNICODE 13  14 BOOL AdjustDacl(HANDLE h, DWORD DesiredAccess) 15 { 16     // the WORLD Sid is trivial to form programmatically (S-1-1-0) 17     SID world = { SID_REVISION, 1, SECURITY_WORLD_SID_AUTHORITY, 0 }; 18      19     EXPLICIT_ACCESS ea = 20     { 21         DesiredAccess, 22             SET_ACCESS, 23             NO_INHERITANCE, 24         { 25             0, NO_MULTIPLE_TRUSTEE, 26                 TRUSTEE_IS_SID, 27                 TRUSTEE_IS_USER, 28                 reinterpret_cast<LPTSTR>(&world) 29         } 30     }; 31     ACL* pdacl = 0; 32     DWORD err = SetEntriesInAcl(1&ea, 0&pdacl); 33     if (err == ERROR_SUCCESS) 34     { 35         err = SetSecurityInfo(h, SE_KERNEL_OBJECT, DACL_SECURITY_INFORMATION, 00, pdacl, 0); 36         LocalFree(pdacl); 37         return(err == ERROR_SUCCESS); 38     } 39     else 40         return(FALSE); 41 } 42  43 // Useful helper function for enabling a single privilege 44 BOOL EnableTokenPrivilege(HANDLE htok, LPCTSTR szPrivilege, TOKEN_PRIVILEGES& tpOld) 45 { 46     TOKEN_PRIVILEGES tp; 47     tp.PrivilegeCount = 1; 48     tp.Privileges[0].Attributes = SE_PRIVILEGE_ENABLED; 49     if (LookupPrivilegeValue(0, szPrivilege, &tp.Privileges[0].Luid)) 50     { 51         // htok must have been opened with the following permissions: 52         // TOKEN_QUERY (to get the old priv setting) 53         // TOKEN_ADJUST_PRIVILEGES (to adjust the priv) 54         DWORD cbOld = sizeof tpOld; 55         if (AdjustTokenPrivileges(htok, FALSE, &tp, cbOld, &tpOld, &cbOld)) 56             // Note that AdjustTokenPrivileges may succeed, and yet 57             // some privileges weren't actually adjusted. 58             // You've got to check GetLastError() to be sure! 59             return(ERROR_NOT_ALL_ASSIGNED != GetLastError()); 60         else 61             return(FALSE); 62     } 63     else 64         return(FALSE); 65 } 66  67  68 // Corresponding restoration helper function 69 BOOL RestoreTokenPrivilege(HANDLE htok, const TOKEN_PRIVILEGES& tpOld) 70 { 71     return(AdjustTokenPrivileges(htok, FALSE, const_cast<TOKEN_PRIVILEGES*>(&tpOld), 000)); 72 } 73  74 HANDLE GetProcessHandleWithEnoughRights(DWORD PID, DWORD AccessRights) 75 { 76     HANDLE hProcess = ::OpenProcess(AccessRights, FALSE, PID); 77     if (hProcess == NULL) 78     { 79         HANDLE hpWriteDAC = OpenProcess(WRITE_DAC, FALSE, PID); 80         if (hpWriteDAC == NULL) 81         { 82             // hmm, we don't have permissions to modify the DACL 83             // time to take ownership 84             HANDLE htok; 85             if (!OpenProcessToken(GetCurrentProcess(), TOKEN_QUERY | TOKEN_ADJUST_PRIVILEGES, &htok)) 86                 return(FALSE); 87              88             TOKEN_PRIVILEGES tpOld; 89             if (EnableTokenPrivilege(htok, SE_TAKE_OWNERSHIP_NAME, tpOld)) 90             { 91                 // SeTakeOwnershipPrivilege allows us to open objects with 92                 // WRITE_OWNER, but that's about it, so we'll update the owner, 93                 // and dup the handle so we can get WRITE_DAC permissions. 94                 HANDLE hpWriteOwner = OpenProcess(WRITE_OWNER, FALSE, PID); 95                 if (hpWriteOwner != NULL) 96                 { 97                     BYTE buf[512]; // this should always be big enough 98                     DWORD cb = sizeof buf; 99                     if (GetTokenInformation(htok, TokenUser, buf, cb, &cb))100                     {101                         DWORD err = 102                             SetSecurityInfo( 103                             hpWriteOwner, 104                             SE_KERNEL_OBJECT,105                             OWNER_SECURITY_INFORMATION,106                             reinterpret_cast<TOKEN_USER*>(buf)->User.Sid,107                             000 108                             );109                         if (err == ERROR_SUCCESS)110                         {111                             // now that we're the owner, we've implicitly got WRITE_DAC112                             // permissions, so ask the system to reevaluate our request,113                             // giving us a handle with WRITE_DAC permissions114                             if (115                                 !DuplicateHandle( 116                                 GetCurrentProcess(), 117                                 hpWriteOwner,118                                 GetCurrentProcess(), 119                                 &hpWriteDAC,120                                 WRITE_DAC, FALSE, 0 121                                 ) 122                                 )123                                 hpWriteDAC = NULL;124                         }125                     }126                     127                     // don't forget to close handle128                     ::CloseHandle(hpWriteOwner);129                 }130                 131                 // not truly necessary in this app,132                 // but included for completeness133                 RestoreTokenPrivilege(htok, tpOld);134             }135             136             // don't forget to close the token handle137             ::CloseHandle(htok);138         }139         140         if (hpWriteDAC)141         {142             // we've now got a handle that allows us WRITE_DAC permission143             AdjustDacl(hpWriteDAC, AccessRights);144             145             // now that we've granted ourselves permission to access 146             // the process, ask the system to reevaluate our request,147             // giving us a handle with right permissions148             if (149                 !DuplicateHandle( 150                 GetCurrentProcess(), 151                 hpWriteDAC,152                 GetCurrentProcess(), 153                 &hProcess,154                 AccessRights, 155                 FALSE, 156                 0 157                 ) 158                 )159                 hProcess = NULL;160             161             CloseHandle(hpWriteDAC);162         }163     }164     165     return(hProcess);166 }167 168 BOOL WINAPI InjectLibW(DWORD dwProcessId, PCWSTR pszLibFile) 169 {170     BOOL fOk = FALSE; // Assume that the function fails171     HANDLE hProcess = NULL, hThread = NULL;172     PWSTR pszLibFileRemote = NULL;173     174     // Get a handle for the target process.175     hProcess = 176         GetProcessHandleWithEnoughRights(177         dwProcessId,178         PROCESS_QUERY_INFORMATION |   // Required by Alpha179         PROCESS_CREATE_THREAD     |   // For CreateRemoteThread180         PROCESS_VM_OPERATION      |   // For VirtualAllocEx/VirtualFreeEx181         PROCESS_VM_WRITE              // For WriteProcessMemory182         );183     if (hProcess == NULL)184         return(FALSE);185     186     // Calculate the number of bytes needed for the DLL's pathname187     int cch = 1 + lstrlenW(pszLibFile);188     int cb  = cch * sizeof(WCHAR);189     190     // Allocate space in the remote process for the pathname191     pszLibFileRemote = 192         (PWSTR) VirtualAllocEx(hProcess, NULL, cb, MEM_COMMIT, PAGE_READWRITE);193     194     if (pszLibFileRemote != NULL)195     {196         // Copy the DLL's pathname to the remote process's address space197         if (WriteProcessMemory(hProcess, pszLibFileRemote, 198             (PVOID) pszLibFile, cb, NULL))199         {200             // Get the real address of LoadLibraryW in Kernel32.dll201             PTHREAD_START_ROUTINE pfnThreadRtn = (PTHREAD_START_ROUTINE)202                 GetProcAddress(GetModuleHandle(TEXT("Kernel32")), "LoadLibraryW");203             if (pfnThreadRtn != NULL)204             {205                 // Create a remote thread that calls LoadLibraryW(DLLPathname)206                 hThread = CreateRemoteThread(hProcess, NULL, 0207                     pfnThreadRtn, pszLibFileRemote, 0, NULL);208                 if (hThread != NULL)209                 {210                     // Wait for the remote thread to terminate211                     WaitForSingleObject(hThread, INFINITE);212                     213                     fOk = TRUE; // Everything executed successfully214                     215                     CloseHandle(hThread);216                 }217             }218         }219         // Free the remote memory that contained the DLL's pathname220         VirtualFreeEx(hProcess, pszLibFileRemote, 0, MEM_RELEASE);221     }222     223     CloseHandle(hProcess);224     225     return(fOk);226 }227 228 229 BOOL WINAPI InjectLibA(DWORD dwProcessId, PCSTR pszLibFile) {230     231     // Allocate a (stack) buffer for the Unicode version of the pathname232     PWSTR pszLibFileW = (PWSTR) 233         _alloca((lstrlenA(pszLibFile) + 1* sizeof(WCHAR));234     235     // Convert the ANSI pathname to its Unicode equivalent236     wsprintfW(pszLibFileW, L"%S", pszLibFile);237     238     // Call the Unicode version of the function to actually do the work.239     return(InjectLibW(dwProcessId, pszLibFileW));240 }