360Lib中的坐标系

来源:互联网 发布:手机网络看不了视频 编辑:程序博客网 时间:2024/06/03 18:48

360Lib是JVET设计的一个360视频投影格式转换和质量评估的工具,其中投影格式转换应该是在之前的PCT360(JVET D0090)基础上改进得到的,支持的格式如下图:
这里写图片描述
注意:其中4(用于生成视窗)和6(用于计算CPP-PSNR)没有提供与其它格式之间的转换。

首先来看360Lib中的3D坐标系。为了描述3D场景,用3D-XYZ坐标系表示,如下图:
这里写图片描述

用经度ϕ [-π, π]和纬度θ [-π/2, π/2]来表示球形视野。(X,Y,Z)和(ϕ,θ)之间的关系为:
这里写图片描述
这里写图片描述

接下来看2D坐标系。屏幕显示是2D图像,因此使用一个uv平面来描述投影的每一个面的图像。而在实际中,需要按像素来处理,因此需要对球形坐标系进行整像素采样,用(m,n)表示采样点坐标。注意m,n分别表示的是采样点的列和行,是整数。两者之间的大致关系如图:
这里写图片描述
注意,(u,v)和(m,n)坐标系的刻度是不同的,不要被误导。

而不同投影格式的采样关系是不同的。以ERP为例,(u,v)和(m,n)之间的关系为:
u = (m + 0.5)/W, 0≤ m < W
v = (n + 0.5)/H, 0 ≤ n < H

其中W,H分别表示图像的宽和高;m,n是整数,表示采样点的列和行,+0.5是由u,v计算m,n时保证四舍五入。可见,u,v的范围为[0,1],是连续的。

这里对连续图像进行了离散采样,引入了失真。

对于上图,uv和mn坐标原点存在偏移,原文解释为

In 360Lib, in order to arrange all sampling points in a symmetric manner in both directions, there is a shift between the origin of (u, v) coordinates and the origin of (m, n) coordinates.

从(u,v)和(m,n)的关系理解比较容易。(u,v)的坐标原点(0,0),对应的(m,n)为(-0.5,-0.5),因此两者的坐标原点是存在偏移的。

以上很多是个人理解,尤其是2D坐标部分,还存在没有理解透彻的部分,可能存在错误,请指正。各格式的表示方法详见JVET-F1003,这里就不贴了。

原创粉丝点击