电脑屏幕捕获编码设计案例

来源：互联网发布：sql使用存储过程编辑：程序博客网时间：2024/04/29 20:55

介绍：

常常我们想要编程捕获整个屏幕的内容，下面将解释如何做到这一点。典型的，我们的选择是使用GDI或者DirectX。另外一个值得考虑的方法是Windows Media API，直接将捕获的屏幕图像编码成码流输出，不过本文中不讨论该方法，主要讨论前两种技术。每一种方法中，我们得到了屏幕快照后，就可以用于保存或者编码输出。下面讨论了两种方法，并给出程序的部分代码和运行截图。

用GDI方法捕获

如果性能不是问题，并且我们需要的只是屏幕快照，就可以考虑采用GDI方法。这种方法基于桌面也是一个窗口的基本思想（桌面也有窗口句柄和设备上下文），只要得到被捕获桌面的上下文，就可以用普通的方法把内容blit到我们应用定义的上下文中。如果知道桌面句柄（可以用函数GetDesktopWindow()函数得到），得到上下文是很直接的。步骤如下：

1）使用GetDesktopWindow获得桌面句柄

2）使用函数GetDC获得桌面窗口的DC

3）为桌面DC创建一个兼容的DC和一个用于选入兼容DC的兼容位图。可以用函数CreateCompatibleDC和CreateCompatibleBitmap；可以用SelectObject将位图选入我们的DC

4）不管何时准备捕获屏幕，blit桌面DC内容到创建的兼容的DC,我们创建的兼容位图现在包含了捕获时刻的屏幕内容

5）当完成捕获后，不要忘记释放对象

例子：

Void CaptureScreen()

    int nScreenWidth = GetSystemMetrics(SM_CXSCREEN);

    int nScreenHeight = GetSystemMetrics(SM_CYSCREEN);

    HWND hDesktopWnd = GetDesktopWindow();

    HDC hDesktopDC = GetDC(hDesktopWnd);

    HDC hCaptureDC = CreateCompatibleDC(hDesktopDC);

    HBITMAP hCaptureBitmap =CreateCompatibleBitmap(hDesktopDC,

                            nScreenWidth, nScreenHeight);

    SelectObject(hCaptureDC,hCaptureBitmap);

    BitBlt(hCaptureDC,0,0,nScreenWidth,nScreenHeight,

           hDesktopDC,0,0,SRCCOPY|CAPTUREBLT);

    SaveCapturedBitmap(hCaptureBitmap); //占位符号，可以在此处放入自己的代码

    ReleaseDC(hDesktopWnd,hDesktopDC);

    DeleteDC(hCaptureDC);

    DeleteObject(hCaptureBitmap);

上面的例子中，函数GetSystemMetrics()如果使用SM_CXSCREEN则返回屏幕宽，如果使用SM_CYSCREEN则返回屏幕的高。参考相关代码细节，我们很容易创建文件或者影片。

采用DirectX的方法：

由于DirectX提供了一个干净的方法，所以捕获屏幕快照在DirectX下非常容易。

每一个DirectX应用都包含了我们称为buffer或者surface的包含了相应于应用的视频内存，被称为后备缓冲。一些程序可能有超过一个后备缓冲。另外有一个所有程序能够存取的前端缓冲，该前端缓冲包含了桌面内容相关的视频内存，所以就是屏幕图像。

通过存取我们应用程序的前端缓冲，我们就可以捕获此刻的屏幕内容。存取应用的前端缓冲是简单直接的。接口IDirect3DDevice9提供了GetFrontBufferData()方法，带一个IDirect3DSurface9对象指针，拷贝前端缓冲的数据进入surface. IDirect3DSurfce9对象能够通过方法IDirect3DDevice8::CreateOffscreenPlainSurface()获得。一旦屏幕被捕获到surface,我们可以使用D3DXSaveSurfaceToFile()以位图方式保存表面到磁盘。捕获代码如下：

extern IDirect3DDevice9* g_pd3dDevice;

Void CaptureScreen()

    IDirect3DSurface9* pSurface;

    g_pd3dDevice->CreateOffscreenPlainSurface(ScreenWidth, ScreenHeight,

        D3DFMT_A8R8G8B8, D3DPOOL_SCRATCH, &pSurface, NULL);

    g_pd3dDevice->GetFrontBufferData(0, pSurface);

    D3DXSaveSurfaceToFile("Desktop.bmp",D3DXIFF_BMP,pSurface,NULL,NULL);

    pSurface->Release();

上面代码中的g_pd3dDevice是一个IDirect3DDevice9对象，假定已经正确的初始化了。代码片断直接保存捕获图像到磁盘。然而，代替保存到磁盘，我们可能想要直接操作这个位图。我们可以通过使用方法IDirect3DSurface9::LockRect()来做到这点，获得一个指向表面的指针。我们可以拷贝图像到应用内存然后操作他们。接下来的代码片断表明了如何拷贝表面到我们的应用内存：

extern void* pBits;

extern IDirect3DDevice9* g_pd3dDevice;

IDirect3DSurface9* pSurface;

g_pd3dDevice->CreateOffscreenPlainSurface(ScreenWidth, ScreenHeight,

                                          D3DFMT_A8R8G8B8, D3DPOOL_SCRATCH,

                                          &pSurface, NULL);

g_pd3dDevice->GetFrontBufferData(0, pSurface);

D3DLOCKED_RECT lockedRect;

pSurface->LockRect(&lockedRect,NULL,

                   D3DLOCK_NO_DIRTY_UPDATE|

                   D3DLOCK_NOSYSLOCK|D3DLOCK_READONLY)));

for( int i=0 ; i < ScreenHeight ; i++)

    memcpy( (BYTE*) pBits + i * ScreenWidth * BITSPERPIXEL / 8 ,

        (BYTE*) lockedRect.pBits + i* lockedRect.Pitch ,

        ScreenWidth * BITSPERPIXEL / 8);

g_pSurface->UnlockRect();

pSurface->Release();

上面的pBits是一个void *，在拷贝之前要确认我们已经分配了足够的内存。一个BITSPERPIXEL的典型值是32位，然后，依赖于你的显示器设置。重要的是注意到表面的宽度与捕获屏幕的宽度并不相同，由于这个问题涉及到内存对齐，表面可能加入附加的部分到每行的结束来对齐到字边界。lockedRect.Pitch给出两个行之间的字节数目，也就是说，为了前进到下一行正确的点，我们应当推进Pitch,而不是Width.下面的代码反向的拷贝表面的字节：

for( int i=0 ; i < ScreenHeight ; i++)

    memcpy((BYTE*) pBits +( ScreenHeight - i - 1) *

        ScreenWidth * BITSPERPIXEL/8 ,

        (BYTE*) lockedRect.pBits + i* lockedRect.Pitch ,

        ScreenWidth* BITSPERPIXEL/8);

这点代码用于转换自顶而下和自底而上的位图。

上面的技术中LockRect是IDirect3DSurface9中存取捕获图像的一个方法，我们还有另外一个更加复杂的方法，GetDC方法。IDirect3DSurface9::GetDC()方法用来获得GDI兼容的设备上下文，这样就可以直接blit表面内容到我们应用定义的DC。

然而，GetFrontBufferData是一个慢的方法，不应当用于性能临界的应用，GDI方法是更快的方法。

捕获程序要点：

程序初始化的时候需要初始化相关资源，在WM_CREATE消息中初始化D3D,然后初始化FFMPEG,同时启动定时器；当用户选择开始捕获的时候，每次定时器到，处理WM_TIMER消息，锁定前端缓冲平面，然后拷贝数据到缓冲区，将该缓冲区传递给FFMPEG编码并输出；当用户停止的时候，停止定时器，清理D3D和FFMPEG，然后退出。下面是几个需要注意的技术点：

1）屏幕的颜色深度，由于屏幕可能处于不同的颜色深度下，所以需要仔细区分，当GetDeviceCaps函数返回颜色深度为16的时候，需要区分是否RGB555或者RGB565,根据颜色深度来设定传递给FFMPEG的像素格式。

2）编码参数的设定，由于编码库支持的图像大小不是任意的，所以需要仔细的设置编码参数，否则不能初始化编码器。

3）图像转换的设定，由于原图像和目的图像的色彩空间和大小都不一样，所以需要仔细考虑图像转换，色彩空间的转换可以用img_convert，大小的转换可以用img_resample，注意到大小转换只针对YUV420P，所以在本案例中是先转换色彩空间，从RGBA32转换到YUV420P，然后调用重采样函数改变大小。

4）编码图像的保存，调用avcodec_encode_video编码图像，然后直接写入文件即可，如果想要从网络输出，那么考虑rtp_callback函数回调，由库来做合适的分包，然后加上合适的头部发送

5）抓屏过程中，程序需要转换成托盘图标。保存为bmp的时候图像行是颠倒的，要把表面的第一行作为bmp的最后一样。传给解码器的是正常坐标

程序运行截图：

该图是采用的捕获工具所截获的H263纯码流通过VLC播放然后用快照功能获得，是CIF的分辨率。

一些可能的改进：

1．针对DirectX和OpenGL的窗口捕获，这个需要采用hook技术，比较麻烦

2．针对不同图像尺寸的编码，目前的库不能支持XGA的H263编码,4cif的编码出现了不规则捕获的问题，问题还没有查清楚，也许是能力问题，也许是程序设计问题。

3．编程中的一些优化和保护措施没有做好，程序运行的时候占用的CPU资源比较大