《视频解密》中文版(第四版) 第三章

来源:互联网 发布:网络帅熊龙二 编辑:程序博客网 时间:2024/05/18 22:40
第三章 色度空间

色度空间是使用数学方法表示一组颜色。三种最流行的表示颜色的模型是RGB(用于计算机图像);YIQ、YUV或YCbCr(用于视频系统);CMYK(用于彩色打印)。然而这三种模型中没有一种能直接反映色调、饱和度和亮度,然而经过用户简单的编程、处理,如在HIS和HSV模型中就会有所表现。

所有其他的色度空间通过照相机和扫描仪的RGB信息引申出来,RGB色度空间是所有其它色度空间的基础。


RGB色度空间

红、绿、兰(RGB)色度空间被广泛应用于计算机显示。红、绿、兰是三种基本色,这三种颜色按一定比例混合可以得到任何颜色。在三维直角坐标系中表示如图3.1。该立方体的对角线上的三原色相等,颜色从白到黑,表示的是不同灰度级。表3.1给出了100% RGB彩条信号的各数值,这个表常用于彩色视频测试。

《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客

 图3.1 RGB色度立方体 

 


 

有效值

绿

品红

0~255

255

255

0

0

255

255

0

0

绿

0~255

255

255

255

255

0

0

0

0

0~255

255

0

255

0

255

0

255

0

表3.1 100% RGB彩条 

由于计算机的显示器采用红、绿、蓝三种元素来显示彩色,所以RGB色度表示法成为最流行的计算机图像表示的方法。选择RGB色度空间使得设计计算机显示系统架构变得简单,而且还可以利用现成的众多软件程序,所以RGB色度空间被使用好多年了。

然而,在实时图像应用领域使用GRB色度空间的效率并不高。合成任何颜色RGB三种元素必须使用相同大小的存储空间,这样一帧图像的缓存需要为每个基色开辟相同的空间,所以处理一副RGB图像的效率通常不高。例如,需要改变一个像素的亮度或色度,需要从视频缓存中读出三基色的值,计算得到当前亮度和色度,根据需要的亮度和色度,重新计算每个基色的值,然后写回到视频缓存中。如果一个系统直接存储的是像素的亮度和色度值,那么这种处理将会变得很快。

由于这样或那样的原因,许多标准视频采用一个亮度空间和两个色度空间,最常用的是YUV,YIQ和YCbCr色度空间。虽然它们互相联系,但仍有区别。

 

YUV色度空间

YUV色度空间是用于PAL制式(逐行倒相)和NTSC制式(美国国家电视标准委员会)和SECAM(赛康制)制式的复合彩色视频标准。黑白电视系统只使用亮度(Y)信息;色度信息(U和V)添加于亮度信号之外,使黑白电视仍能显示黑白信号,彩色电视可以解出彩色信号显示彩色图像。

GRB到YUV的转换方程如下( 为经过伽马校正的RGB信号,将在本章后面讨论):< xmlnamespace prefix ="v" ns ="urn:schemas-microsoft-com:vml" />

《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客

 < xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" />

由于 的取值范围为0~255,所以Y的取值范围为0~255,U的取值范围为0~ ,V的取值范围为0~ 。在NTSC或PAL数字编解码时这些方程系数通常会被简化使用。

8位YUV和 数据必须的取值范围必须在0~255之间,以防止数据的上溢或下溢导致数据循环问题。

如果(B’-Y)和(R’-Y)使用的全局范围,那没复合NTSC和PAL将会超出范围。实验表明,如果副载波超过20%的漂移,那么亮度信号(Y)将超过白色的最大值和黑色的最小值。尺度变换因子选择最大幅度的75%,100%彩条信号黄色和青色将超过最大的白色值。


YIQ色度空间

YIQ色度空间(第八章中将进一步讨论),从YUV衍生过来,可以用于NTSC符合彩色视频标准。(“I”代表同相分量,“Q”代表正交分量,这是在发送彩色信息时的调制手段。) 和YIQ的基本方程为:   

《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客

 由于 的取值范围为0~255,所以Y的取值范围为0~255,I的取值范围为0~ ,Q的取值范围为0~ 。I和Q是U和V旋转 得到的。在NTSC数字编解码是这些方程的比例系数通常简化使用。

8位YUV和 数据必须的取值范围必须在0~255之间,以防止数据的上溢或下溢导致数据循环问题。


YCbCr色度空间

YCbCr色度空间是在ITU-R BT.601标准开发时提出来的,ITU-R BT.601是全球数字视频部件接口的标准(将在第四章中讨论)。YCbCr是YUV色度空间经过偏移、缩放变换得到的另一个版本。Y定义为一个8比特数字,范围为16~235,Cb和Cr被定义成范围为16~240的8比特数字。有几种YCbCr的格式,如4:4:4,4:2:2,4:1:1和4:2:0。


RGB-YCbCr方程:标清电视

R'G'B'和YCbCr(取值范围16~235)的基本转换方程为:

《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客

 

当进行从YCbCr到 转换时, 的值的通常范围是16~235,偶尔也可能会是1~15和236~255之间的值,这是由于在视频处理和噪声干扰情况下Y和CbCr的值偶尔会在16~235和16~240之外的缘故。8位YCbCr和 数据必须的取值范围必须在0~255之间,以防止数据的上溢或下溢导致数据循环问题。

表3.2表示的是YCbCr 75%幅度的100%饱和度的彩条信号,用于彩色视频信号测试。

 


 

有效值

绿

品红

SDTV

Y

16~235

180

162

131

112

84

65

35

16

Cb

16~240

128

44

156

72

184

100

212

128

Cr

16~240

128

142

44

58

192

212

114

128

HDTV

Y

16~235

180

168

145

133

63

51

28

16

Cb

16~240

128

44

147

63

193

109

212

128

Cr

16~240

128

136

44

52

204

212

120

128












表3.2 75% YCbCr 彩条


计算机系统考虑(标清)

在计算机系统中, 数据通常的取值范围是0~255,下面的转换方程更适合应用:

《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客

 

8位YCbCr和 数据必须的取值范围必须在0~255之间,以防止数据的上溢或下溢导致数据循环问题。


RGB-YCbCr方程:高清电视

R'G'B'和YCbCr(取值范围16~235)的基本转换方程为:

《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客

 

当进行从YCbCr到 转换时, 的值的通常范围是16~235,偶尔也可能会是1~15和236~255之间的值,这是由于在视频处理和噪声干扰情况下Y和CbCr的值偶尔会在16~235和16~240之外的缘故。8位YCbCr和 数据必须的取值范围必须在0~255之间,以防止数据的上溢或下溢导致数据循环问题。

表3.2表示的是YCbCr 75%幅度的100%饱和度的彩条信号,用于彩色视频信号测试。


计算机系统考虑(高清)

在计算机系统中, 数据通常的取值范围是0~255,下面的转换方程更适合应用:

《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客 

8位YCbCr和 数据必须的取值范围必须在0~255之间,以防止数据的上溢或下溢导致数据循环问题。


4:4:4 YCbCr格式

图3.2表示的是4:4:4格式YCbCr采样点的位置。每一个采样点都包含一个Y、Cb、Cr的值,每一个采样点在消费类应用领域为8比特数据,视频前端处理领域为10比特数据。所以每一个点需要24比特或30比特数据量。

 

《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客

 图3.2 4:4:4采样点位置(隔行扫描图片的有效行)


4:2:2 YCbCr格式

图3.3表示的是4:2:2格式YCbCr采样点的位置。每2个水平Y采样点,包含1个Cb和Cr采样点,每一个采样点在消费类应用领域为8比特数据,视频前端处理领域为10比特数据。所以每一个点需要16比特或20比特数据量,视频格式经常使用的方法如图3.4所示。

为了显示4:2:2格式的YCbCr数据,采用差值法将缺的Cb和Cr信号补全成为4:4:4格式的YCbCr数据。

《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客 

图3.3 4:2:2YCbCr采样点位置(隔行扫描图片的有效行)

《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客 

图3.4 4:2:2YCbCr帧缓存格式


4:1:1 YCbCr格式

图3.5表示的是4:1:1格式YCbCr(也被称为YUV12)采样点的位置,被应用于某些消费类视频和DV视频的压缩。每4个水平Y采样点,包含1个Cb和Cr采样点,每一个采样点为8比特数据,所以每一个点需要12比特数据量,视频格式经常使用的方法如图3.6所示。

为了显示4:1:1格式的YCbCr数据,采用差值法将缺的Cb和Cr信号补全成为4:4:4格式的YCbCr数据。

《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客 

图3.5 4:1:1YCbCr采样点位置(隔行扫描图片的有效行)

《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客 

图3.6 4:1:1YCbCr帧缓存格式


4:2:0 YCbCr格式

不像4:2:2方式只减少水平色度信号表示方式,4:2:0将亮度信号和色度信号之比编程2:1,Cb和Cr信号在水平和垂直方向同时减少。4:2:0方式一般用于视频压缩。

图3.7到3.11表示的是各种4:2:0格式YCbCr采样点的位置,表3.3列举出了各种YCbCr格式在数字视频领域的应用。

为了显示4:2:0格式的YCbCr数据,采用差值法产生新的Cb和Cr信号补成4:4:4格式的YCbCr数据。由于缺少所需色度值,MPGE解码器不能将4:2:0的YCbCr的数据转换成4:4:4的YCbCr数据。

《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客

 

图3.7 4:2:0YCbCr采样点位置,应用于H.261,H.263和MPEG-1(逐行扫描图片的有效行或隔行扫描的一场)

《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客

图3.8 4:2:0YCbCr采样点位置,应用于MPGE-2,MPEG-4第二部分和H.264(逐行扫描图片的有效行或隔行扫描的一场)

《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客

 图3.9 4:2:0YCbCr采样点位置,应用于MPGE-2,MPEG-4第二部分和H.264 (隔行扫描图片的有效行 ,顶场地一行为1)

《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客

图3.10 4:2:0YCbCr采样点位置,应用于MPGE-2,MPEG-4第二部分和H.264 (隔行扫描图片的有效行,顶场地一行为0)

《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客

 图3.11 4:2:0YCbCr采样点位置,应用于576i和DV摄像机,(隔行扫描图片的有效行)

 


YCbCr格式

25Mbps DV

50Mbps DV

100Mbps DV

MPGE-1

MPEG-2,-4Part2,H.264

H.261,H.263

480-行DV

576-行DV

480-行DVCAM

576-行DVCAM

DV-7(DVCPRO)

DVCPRO 50

Digital Betacam

D-9(Digital S)

DVCPRO HD

D-9 HD

4:4:4 Co-Sited

 

 

 

 

 

 

 

 

 

 

 

 

4:2:2 Co-Sited

 

 

 

 

 

 

 

4:1:1 Co-Sited

 

 

 

 

 

 

 

 

 

 

4:2:0

 

 

 

 

 

 

 

 

 

 

4:2:0 Co-Sited

 

 

 

 

 

 

 

 

 

 

 

表3 YCbCr 在各种数字视频领域的应用


PhotoYCC色度空间

PhotoYCC(伊士曼·柯达公司的商标)色度空间应用于图像CD光盘,它的目标是开发一个与显示设备无关的色度空间。为了达到最佳的显示效率,这个色度空间建立在ITU-R BT.601和BT.709基础之上。

从RGB到PhotoYCC的编码过程假设采用的是符合CIE标准 光源,该图像采集系统的光谱灵敏度正比于BT.709规范选定的色彩匹配功能。不同于计算机显示系统,RGB的值可以取负值。PhotoYCC包含的色度超出了BT.709的色域;超出部分编码使用的是负值的色度值。


RGB到PhotoYCC

《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客

 

作为一个例子,20%灰度值(R,G,B=0.2)将在PhotoCD磁盘上记录如下的值:

Y=79

C1=156

C2=137


PhotoYCC到RGB

由于PhotoYCC试图保留大动态范围的图片信息,PhotoYCC图片的解码需要选择适当的色度空间和动态范围以满足输出设备的显示。所以解码方程并不是编码方程的反过程。下面的方程产生的RGB信号比较适合CRT显示,假设编码图像和显示图像是统一和相关的。

《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客

HSI,HLS和HSV色度空间

HIS(色度、饱和度、亮度)和HSV(色度、饱和度、值)色度空间开发于人造色,用于人类视觉系统感知和解释颜色。它们用于手动指定颜色,也用于现在很少使用的视觉颜色制定和Pantone配色系统。这些色度空间只限于有兴趣的历史探讨。HLS(色度,亮度,饱和度)类似于HIS;单词lightness和intensity意义相同。

HIS和HSV的不同之处是计算亮度分量的方法(I或V),这决定了亮度信号(I或V)和色度信号的动态取值范围。HIS色度空间最佳应用环境是卷积、均衡、直方图等传统的图像处理领域,由于I对R、G、B依赖程度相同,所以这些操作亮度值的计算相当方便。由于HSV的饱和度有更大的动态范围,HSV色度空间适合于色度和饱和度操作(颜色变换或色度调整)。

图3.12是HSV色度空间单六角锥体模型。六角锥的最高点V=1,亮度最大值。六角锥的底点V=0,代表黑色。H通过与垂直轴(V)的垂直平面里与S角度来度量,H相差 的点是互补色,红色是 。S的值用斜率表示,范围从0(在V轴的原点)到1(六角锥的边界)。在V=0的点S可以取0~1之间的任何值。在S= 0时,V= 1代表白色。在S=0时,V的中间值代表灰色。注意,当S=0时,H可取任何值。从艺术的角度看,V=1,S=1时,任何颜色都是纯色(它的颜色取决于H值)。在V值不变时,增加白色分量将降低S分量值;S值不变时,增加黑色分量将降低V分量值。通过降低S和V分量将改变色调。表3.4列举出了,75%幅度的HSV100%饱和度的各彩条信号的值。

《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客

 图3.12 HSV色度空间的单六角锥模型

 


 

有效范围

绿

品红

H

-

-

S

0~1

0

1

1

1

1

1

1

0

V

0~1

0.75

0.75

0.75

0.75

0.75

0.75

0.75

0

表3.3 75% HSV彩条信号

 

图3.13表示的是HIS色度空间的双六角锥模型。六角锥的最高点I=1,代表白色;最低点I=0,代表黑色。H通过与垂直轴(I)的垂直平面里与S角度来度量,H相差 的点是互补色,红色是 (考虑HSV模型,我们依照泰克公约改变兰色位于 )。S值范围从0到1表示从垂直轴I到六角锥的表面。除了S=1,I=0.5时,S=0时灰度可取任意值。表3.5列举了75%幅度的HSI100%饱和度的各彩条信号的值。

《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客

 图3.13 HIS色度空间的双六角锥模型 


 

有效范围

绿

品红

H

-

-

S

0~1

0

1

1

1

1

1

1

0

I

0~1

0.75

0.375

0.375

0.375

0.375

0.375

0.375

0

表3.4 75% HSI彩条信号


三原色色度图

一个正常视力人类色域感知图如图3.14所示(1931年CIE观察者标准)。这张图的数学基础在1960年和1976年进行了完善;NTSC电视系统仍以1931年的标准为基础。

视觉颜色感知的度量是采用CIE规定的3种基本色的组合:波长700nm的红色,波长546.1nm的绿色和波长435.8nm的兰色。这些基本色以及有这些基本色的组合产生的其它纯色组成了图3.14中的边界曲线(叫做光谱轨迹)。

光谱轨迹的两端(红色和兰色)以一条直线连接,代表紫色,它是红色和兰色混合而成的。由整个边界线组成平面包含了所有的颜色,这些颜色可以通过混合三种基本色的不同组合产生。颜色越靠近边界线,饱和度越高;从边界线内部越靠近中部颜色越浅,中心为白色。图中的任何一点,表示唯一一种颜色,可以用x,y坐标表示。

《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客

 图3.14 CIE 1931年标准色度图 

在CIE系统中,红、绿、兰的亮度被叫做三色刺激值,用大写的X,Y,Z表示,它们的值表示三基色的相对数量。

图3.14的坐标量有三激值推导得到:

坐标量x,y,z叫做色度坐标,它们加起来的值为1。z可以表示为x和y导出,所以只用x和y就可以表示所有颜色,色度图可以认为是2维的。

通常情况下,一个显示器定义三个(x,y)坐标量来定义它的三个基色。三个坐标点(x,y)所形成的封闭三角形,成为了者显示器可以显示的色度图。如图3.15所示,图中对NTSC、PAL和典型的油墨和染料色度进行了对比。注意任何3色装置都不能产生所有的颜色,这也是电视图像不能达到自然图像一样效果的缘故。

另外,由于纯白色不能获得或合成,显示器一般将某个坐标(x,y)定义成白色。白颜色定义从吸色器获取或者由三基色分量相同时产生的,所以会有阴影。1931年CIE标准色度图中不包含亮度信息,但可以用一条垂直与(x,y)平面的直线表示。饱和度越低的颜色,越接近于色度图的中部。

1953年指定的NTSC制式三原色分量和参考白色(CIE C标准光源)的色度值分别是:

《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客

 《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客

 由于不同的视频规范应用不同的三元基色和参考白色标准,当视频源和显示器的色度标准不匹配时,例如在高清电视上显示480i或480p的节目,或者在NTSC制式的电视上显示高清电视节目,显示器就会出现小的色差。这些小色差可以通过简单的3×3阵列乘法器解决,将在第7章中详细讨论。


RGB色度空间详述

当处理非RGB色度空间(如YIQ,YUV或YCbCr)信息时,必须注意,复合值产生的结果在RGB色度空间是无效的。无效是指RGB的各元素是在归一化的RGB之外,RGB要限制于(1,1,1)。

例如,对于GRG规范化的值(1,1,1),计算得到YCbCr的值是(235,128,128)。如果由Cr、Cb计算得到的YCbCr的值是(235,64,73),由此得到的RGB值为(0.6,1.29,0.56),这里绿色分量就超过限定值1了。

图3.16显示了归一化的RGB色度空间转换成YCbCr色度空间图。从图中可以看到许多Y、Cb,Cr计算得到的RGB值都是非法的;这些YCbCr值必须经过处理,使得在向RGB色度空间转换时得到有效的RGB值。

为获得最佳的结果,使用固定亮度和固定色度─Y固定时,Cb、Cr的最大值为色度无效之前的Cb、Cr值。色度常量的规则是从复合变量CbCr无效的地方开始向CbCr原点方向移动,直到由YCbCr计算得到的RGB无效为止。

当从非RGB色度空间向RGB色度空间转换时,考虑到数字电路的处理特性,必须注意色度空间转换时防止循环上溢或者下溢。8位精度的RGB值在小于0时设置为0,在大于255时设置为255。

《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客

 图3.16 受限RGB色度空间转换成YCbCr色度空间三维图


伽马校正

大多数CRT显示器的传递函数与输入信号幅度的指数幂(指伽马)。高亮度信号将扩张,低亮度信号就收缩(见图3.17)。由于人眼对相同强度变化的亮度具有基本相同的敏感度,这对抑制噪声是有好处的。在伽马矫正在视频传输之前,传输到显示器的视频的亮度信号是一条近似的直线(图3.17的灰线),传输时还会降低噪声。

为了最大限度地减少图像的暗区噪声,现代的视频系统限制在黑色区域的增益曲线。这项技术限制了接近黑色区域的增益,其他区域的增益曲线保持了正切连续性。

虽然视频标准假设显示器的伽马指数为2.2,但对于CRT显示器的伽马指数更接近如2.5。这个指数对于在黑暗环境观看下更合适,在明亮环境中更适合使用的伽马指数是1.14(2.5/2.2)。通常会根据上述情况调整伽马曲线,使显示器视频看起来更接近于电影视觉。

《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客

 图3.17 伽马效应


早期NTSC制式系统

最早期的NTSC系统假设显示器具有简单的传递特性,伽马系数设为2.2。RGB的各数值规范到0~1:

《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客
《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客
《视频解密》中文版(第四版) 第三章 - 生翼 - 生翼的博客

 虽然PAL和SECAM制式的伽马系数是2.8,但是现在[1/0.45]的伽马系数变成了通用的系数。所以上面的变换方程现在也用于PAL和SECAM制式的576i和576p视频系统。


非CRT显示器

对于像LCD、LCOS、DLP和等离子这种不是基于CRT的显示器,它们的显示传递函数和CRT显示器不同。为了使接口简单,这些电子设配设计成可以接收标准伽马校正的视频,然后再将视频进行补偿变换以适合它们显示。


恒定亮度问题

由于伽马校正和矩阵运算的顺序不正确,U和V(或Cb和Cr)信号就会影响亮度分量信号(Y)。当U和V信号的幅度超出有效范围时,将导致亮度信号的超出范围,从而视觉出错。这可能是由于U和V信号的带宽限制或者错误设置了U、V信号的增益。

对于低频谱颜色是没有问题的,但当颜色频谱高时,U、V分量将消失, 分量变小到至等于Y分量。


参考资料

1、Benson, K. Blair, Television Engineering Handbook. McGraw-Hill, Inc., 1986.

2、Clarke, C.K.P., 1986, Colour Encoding and Decoding Techniques for Line-Locked Sampled PAL and NTSC Television Signals, BBC Research Department Report BBC RD1986/2.

3、Devereux, V. G., 1987, Limiting of YUV digital video signals, BBC Research Department Report BBC RD1987 22.

4、EIA Standard EIA–189–A, July 1976, Encoded Color Bar Signal.

5、Faroudja, Yves Charles, NTSC and Beyond. IEEE Transactions on Consumer Electronics, Vol. 34, No. 1, February 1988.

6、ITU-R  BT.470–6, 1998, Conventional Television Systems.

7、ITU-R BT.601–5, 1995, Studio Encoding Parameters of Digital Television for Standard 4:3 and Widescreen 16:9 Aspect Ratios.

8、ITU-R BT.709–5, 2002, Parameter Values for the HDTV Standards for Production and International Programme Exchange.

9、Photo CD Information Bulletin, Fully Utilizing Photo CD Images–PhotoYCC Color Encoding and Compression Schemes, May 1994, Eastman Kodak Company.

0 0