高通Android平台下zoom4X实验原理分析
来源:互联网 发布:最近淘宝流量出奇的少 编辑:程序博客网 时间:2024/06/04 18:19
最近负责一个项目(手机)上camera的功能,其中有要求做zoom这个功能(项目上要求对所有的分辨率都可以支持4X的zoom),所以把这个部分比较全面的学习了一下,本文对高通在android平台上zoom的实现原理做一个深入的分析,包括的部分主要有zoom功能所涉及高通HW模块的原理架构、高通在android软件中digital zoom的实现流程以及具体的相关接口参数介绍,旨在让读者能够对高通android平台下digital zoom的实现原理及架构有一个清楚的了解。Digital zoom 原理介绍这里提到的digital zoom,即数码变焦,是相机变焦的一种;另外一种为光学变焦,主要是在数码相机中有所应用,它通过相机镜头的移动来放大与缩小需要拍摄的景物,光学变焦倍数越大,能拍摄的景物就越远,而且不会影响画质。本章节重点介绍数码变焦部分,这种变焦在手机中应该较为广泛。手机上的数码变焦是通过手机内的处理器,把图片内的每个象素面积增大,从而达到放大目的。这种手法如同用图像处理软件把图片的面积改大,不过程序在手机内进行,把原来sensor上的一部份像素使用"插值"处理手段做放大,将sensor上的像素用插值算法将画面放大到整个画面。通过数码变焦,拍摄的景物放大了,但它的清晰度会有一定程度的下降,所以数码变焦并没有太大的实际意义。 数码变焦一般分为分为2个步骤,crop和插值放大。另外,数码变焦有2种状况:一种是用户需要拍照画面的尺寸和sensor输出画面的尺寸是一致的;另一种则是用户需要拍照画面的尺寸×zoom等级后比sensor输出画面的尺寸小。在第二种情况下只需要crop就可以了(具体要根据zoom等级计算) 关于zoom的等级,倍数越高,crop的像素就越少,以拍照3M(2048×1536,sensor输出的原始照片为3M)的照片为例,如果做2X的zoom,那么需要从原始照片中crop出1024×768的画面,然后再插值放大成2048×1536;如果是4X的zoom,那么需要从原始照片中crop出512×384的画面,然后再插值放大成2048×1536,以此类推。倍数是指宽和高的倍数,而非面积。 可以发现,zoom前后照片大小是一致的,但照片的范围变小了,感觉是镜头拉近了,其实就是通过crop后再插值放大来完成,zoom的倍数越高,需要插值的像素就越多,zoom后的照片就会越模糊。Note:这里的插值放大是指软件算法,和图像处理软件中那种线性放大是不同的,关于算法的实现这里不多介绍了。 2、用户需要拍照画面的尺寸×zoom等级后比sensor输出画面的尺寸小在这种状况下是不需要插值放大的,图片的质量并没有降低;但如果zoom的等级比较大,比如要4x的zoom,那么光靠crop是不行的,还是得再通过插值放大来完成。通常说来,如果拍照的分辨率比较小,zoom大都可以只通过crop的方式来完成。在上章节中介绍了digital zoom的效果以及基本的实现原理,本章将着重介绍高通平台上实现digital zoom所涉及的相关模块架构,因为digital zoom是camera中的一个feature,分别需要在preview和snapshot中完成,所涉及的相关模块也都是和camera相关的, 各个模块的用途如下(这里主要介绍sensor、VFE和MDP):1、 Sensor 虽然本身也有zoom的功能,但在这里并未使用。Preview时如果做digital zoom,只是正常的输出frame而已,比如输出30fps的VGA 数据(YUV)。2、 VFEDSP的一部分,功能主要都是和图像处理相关,在zoom的时候,它的用途主要就是Crop(剪裁),它会把sensor输出的VGA数据crop成preview时所需要大小的数据,如CIF(352×288),这样的话相当于已经做了一部分zoom(640/352),大概是1.8X,如果不够,剩余的zoom将由后面的MDP来完成。Note:VFE只有crop的功能,没有up scale(放大)的能力,所以VFE最多只能完成有限的zoom。3、 MDP这是一个专门处理显示数据的处理器,功能比较齐全,在zoom的时候主要的用处就是crop+up scale。因为VFE的zoom能力有限,所以当VFE不能满足要求的时候,MDP则继续完成剩余的zoom,比如:如果要求preview画面的大小为QVGA,现在要做4X的zoom,那么VFE会从原始的VGA数据中crop出QVGA大小的数据,相当于已经做了2X的zoom,那么剩下的2X zoom怎么做呢?MDP会从VFE输出的QVGA(320×240)数据中crop出160×120大小的数据(从中间截取),然后再upscale成QVGA大小的数据送到LCD显示,这样相当于又做了2X的zoom,所以加起来一共做了4X的zoom。Note:MDP最大可以进行4X的upscale。下面介绍一下snapshot时各个模块对于zoom的用途:1、 Sensor输出拍照需要的原始数据。在当前应用中,不管设置的拍照分辨率是多少,我们要求sensor输出的拍照数据是固定的,即最大3M(2048*1536,以ICE为例)。2、 VFE功能和preview时候是一致的,只不过在拍照的时候,VFE会根据zoom的等级以及需要拍照的分辨率来自动crop出合适大小的数据。例如选择拍照的分辨率为2048×1536,zoom的level为4X,那么VFE将从原始的2048×1536的数据中crop出512×384大小的数据,后面的zoom由Video core中的jpeg encoder完成。还有一种状况,如果拍照的分辨率较小,那么有可能只通过VFE的crop就可以完成zoom功能,比如拍照的分辨率为1024×768,这个时候如果做2X的zoom,那么VFE只需要从原始的2048×1536的数据中间直接crop出1024×768的数据即可,后面就不需要再用jpeg encoder来zoom了。但如果zoom的等级比较高,后面的2X zoom还是要通过jpeg encoder来做了。3、 Video core 负责把VFE输出的数据encoder成jpeg文件,这里的jpeg encoder还有一个比较重要的功能,那就是upscale,通过这个功能,再搭配之前VFE的crop功能,zoom就可以完成了。 Note:Jpeg encoder的upscale功能是有限的,最大可以进行4X的放大,目前可以满足ICE上的需求。 可以看出,从HW架构来说,preview和snapshot只是在后面的upscale部分有所区别,前者是通过MDP来完成,后者则是通过jpeg encoder(DSP)来完成。 高通 Android平台软件架构分析(digital zoom相关)本章将从软件角度来分析一下高通Android平台下digital zoom的架构以及实现流程,下面先来看一下Android中camera部分的软件架构。Note:目前以Android donut版本为例,高通在android éclair版本上还没有导入先来看一下Preview的流程:1、VFE driver会把从sensor传送来的frame数据crop成上层需要的大小(具体如果crop要根据zoom的level),然后连同crop信息一起把数据传送到HAL。2、HAL层不会对preview数据做任何处理,它会这些数据原封不动的callback到camera service,同样包含crop info(下章节会详细介绍crop info)。3、Camera service在一开始的时候会在surfaceflinger中创建一个surface。当camera service收到preview数据的时候,2个主要接口会被调用:1) zoomUpScale_callback通过调用mSurface->updateCropRect接口把crop相关信息通知给surfaceflinger2) previewCallback通过调用mSurface->postBuffer接口把preview的数据传递给surfaceflinger。4、Surfaceflinger收到数据和crop信息后会调用copybit的接口来驱动MDP去做相关的动作(crop&upscale),然后就去画屏了。再来看一下snapshot时的流程:1、VFE driver把从sensor传递来的原始拍照数据(最大分辨率:2048×1536)crop成zoom需要大小的数据,连同crop信息一起传递给HAL。2、HAL层收到snapshot的数据后会先去检查crop info,判断是否需要jpeg encoder去做upscale的动作。如果不需要就直接encode成jpeg数据;如果需要,填好upscale的参数再做encode。3、Jpeg encoder后的数据会从HAL callback到camera service,camera service会在通知上层去把数据写成文件。由此可见,在snapshot的时候,整个zoom在HAL就可以完成了,而不像preview的时候,需要在surfaceflinger中配置MDP协助完成。具体的原理在第二章节中有详细的叙述,这里就不重复了。Zoom相关接口及参数介绍本章将从代码的层次来分析一下zoom的实现原理及流程。Note:基于高通5110 release的code首先来看一些配置参数(基于HAL):#define MAX_ZOOM_LEVEL 5//对于user来说可以zoom的等级static const int ZOOM_STEP = 6;//每次zoom时的幅度,可以修改另外需要说明高通VFE中zoom的最大值为60(和分辨率无关)。所在在ICE上我们应该让MAX_ZOOM_LEVEL×ZOOM_STEP=60。要么增大MAX_ZOOM_LEVEL,要么增大ZOOM_STEP。下面再来看一下zoom等级的对应关系(高通可以做到最大的就是zoom 4X,这个是HW(MDP和jpeg encoder)的限制): 下面看一下HAL层zoom的接口HAL层的接口比较简单,就是setZoom,上层传递一个zoom的level即可,执行时会判断参数,如果没有超出则通知VFE进行crop, 所以surfaceflinger在更新画面的时候就会根据这些参数来配置MDP,完成后续的操作了。 拍照的时候同样也是这样的原理,差别在于crop中的信息不需要传递给上层,而是直接传递给jpeg encoder即可(写到mDimension这个结构体中),如下(HAL中的receiveRawPicture函数):Jpeg encoder完成后,HAL只需要把zoom好的jpeg data callback给上层就OK了,所以拍照部分的zoom不需要上层额外的处理。 下面看看Camera service里面是怎么处理的? Camera service收到callback后会把crop相关信息及标志更新到preview所申请的surface中,如下: 下面看一下VFE输出数据的格式:在Preview的时候,通过MSM_CAM_IOCTL_GETFRAME系统命令从底层得到preview的数据,格式如下: buffer为数据地址,y_off和cbcr_off分辨为Y的偏移和CBCR的偏移,通过y_off=0,cbcr_off=w*h,这里和zoom相关的是cropinfo,比较重要, 可以看出有2个buffer的参数,其中1是preview的,2是snapshot的。如果没有开启zoom功能,这些参数都是空的;如果zoom的level比较低,VFE足以处理,那么这些参数也是空的。只有当VFE不足以处理所需要的zoom level时,这些参数的值才有意义。具体含义如下:out的值代表上层需要数据的宽和高,比如说上层设置的preview大小为480×320,那么out1_w=480;out1_h=320;而in的值则代表后端的MDP或是jpeg encoder需要crop的大小,举例来说明: Sensor输出VGA preview画面,MMI设置HVGA preview大小,如果要做2X的zoom,VFE能力有限,只能做640/480=1.3X,这个时候VFE输出数据是crop后的HVGA数据,crop信息中的in1_w=320;out1_w=216,意思是后面的MDP需要从HVGA的数据中crop出320×216大小的数据,然后在scale成HVGA,这样整体算起来就是zoom 2X了。 所以HAL只需要将preview数据以及crop info传递给上层即可,这里是通过callback进行的