DllMain中不当操作导致死锁问题的分析--导致DllMain中死锁的关键隐藏因子2

来源:互联网 发布:淘宝收货时间延长 编辑:程序博客网 时间:2024/06/01 18:09

(转载于breaksoftware的csdn博客)

本文介绍使用Windbg去验证《DllMain中不当操作导致死锁问题的分析--导致DllMain中死锁的关键隐藏因子》中的结论,调试对象是文中刚开始那个例子。

        1 g 让程序运行起来

        2 ctrl+break 中断程序

        3 ~ 查看线程数


        其实该程序自己运行起来的线程只有ID为0、TID为afc的线程。18c4线程是我们在windbg中输入ctrl+break,导致windbg在我们调试的进程中插入的一个中断线程。以后我们看到是这个线程的操作,就可以忽略。

        4 dd fs:[0] 寻找主线程TEB起始地址(7ffde000)


      5 dt _TEB 7ffde000 查看主线程中PEB结构指针(0x7ffdc000)


        6 dt _PEB 0x7ffdc000 寻找LoaderLock的指针(0x7c99e0174)


        7  dt_RTL_CRITICAL_SECTION 0x7c99e174 查看临界区状态,我们看到看到LockCount值为-1,那么我们通过给它设置“写”断点,从而在每次“关键”时刻予以监控。


        8 baw2 0x7c99e178 对LockCount设置写断点

        9 g 

        10kb 我们看到线程号是1,即Windbg插入的线程导致的断点,我们忽略之(我们看到关闭线程时也会进入临界区)


        11 g

        12 kb 同上,忽略之

        13 g

        14 kb 这次是主线程(0)触发了断点,断点原因是LdrLoadDll中要加锁。


        我们使用IDA反编译LdrLoadDll,可以看到调用的位置

[cpp] view plaincopy
  1. v4 = RtlDosApplyFileIsolationRedirection_Ustr(1, a3, &unk_7C99E214, &v11, &v14, &v17, 0, 0, 0);  
  2.  v5 = v4;  
  3.  if ( v4 >= 0 )  
  4.  {  
  5.    v9 = 1;  
  6.  }  
  7.  else  
  8.  {  
  9.    if ( v4 != -1072365560 )  
  10.      goto LABEL_6;  
  11.  }  
  12.  LdrLockLoaderLock(1, 0, &v10);  
  13.  ms_exc.disabled = 0;  
        15 g

        16 kb 还是主线程(0)触发了断点,原因是LdrLoadDll中调用了LdrpLoadDll,该函数中需要进入临界区,这是第二次进临界区了。在《Best Practices for Creating DLLs中有对这种现象允许的说明

[plain] view plaincopy
  1. The loader lock is recursive, which means that it can be acquired again by the same thread.    

        在LdrLoadDll中我们看到

[cpp] view plaincopy
  1. LdrLockLoaderLock(1, 0, &v10);  
  2.   ms_exc.disabled = 0;  
  3.   if ( LdrpTopLevelDllBeingLoaded )  
  4.   {  
  5.     if ( ShowSnaps || LdrpShowRecursiveDllLoads || LdrpBreakOnRecursiveDllLoads )  
  6.     {  
  7.       DbgPrint("[%lx,%lx] LDR: Recursive DLL load\n");  
  8.       DbgPrint("[%lx,%lx]   Previous DLL being loaded: \"%wZ\"\n");  
  9.       DbgPrint("[%lx,%lx]   DLL being requested: \"%wZ\"\n");  
  10.       if ( LdrpCurrentDllInitializer )  
  11.         DbgPrint("[%lx,%lx]   DLL whose initializer was currently running: \"%wZ\"\n");  
  12.       else  
  13.         DbgPrint("[%lx,%lx]   No DLL initializer was running\n");  
  14.     }  
  15.   }  
  16.   LdrpTopLevelDllBeingLoaded = v17;  
  17.   v6 = LdrpLoadDll(v9, a1, a2, v17, a4, 1);  

        在LdrpLoadDll中我们看到



        17 g

        18 kb 第三次进入临界区


        19 g 主线程第一次退出临界区


        20 kb 主线程第四次进入临界区


        21 g 主线程第二次退出临界区


        22 g 有线程要进入临界区


        23 kb 这次是我们在代码中启动的工作线程(1)要尝试进入临界区


        24 ~ 查看线程 确定有两个线程了


        25 g 


        26 kb 工作线程(1)要进入临界区,可是它不会进去的,因为它会被挂起


        27 g 死锁了


        28 control+break windbg要启动一个中断线程,中断线程触发了断点


        29 ~ 查看线程,ID为2的就是windbg插入的线程


       30 ~0s 切换到主线程(0),发现主线程在内核态中出不来了


        31 kb 查看主线程调用堆栈,确实是在等工作线程结束


        32 ~1s 切换到工作线程,发现它也在内核态中出不来了


        33 kb 查看工作线程调用堆栈


        34 dt _RTL_CRITICAL_SECTION 0x7c99e174  查看临界区所有权,从线程TID中我们可以看到,临界区的确是被主线程占着。

0 0
原创粉丝点击