关于 DXT1 格式的解码优化

来源:互联网 发布:在淘宝上卖什么好赚钱 编辑:程序博客网 时间:2024/06/13 05:11
DXT1 使用的是 4x4 像素一个单元. 两个 16bit 的调色盘. 
如果没有透明色的话, 还需要插值出 2 种颜色.

c2=c0*2/3+c1*1/3
c3=c0*1/3+c1*2/3

因为两个色盘正好可以读进一个 dword 寄存器, 所以我们可以把 c0, c1 两种颜色读到两个寄存器中. 方便计算. 类似的代码可以写成这样:

mov eax,[pal]
mov ebx,eax
swap ax,bx

接下来做 alpha 混合的时候可以继续取掩码, 把 RGBRGB 变成 0G0R0B 的方式计算.

这种混合运算其实可以优化为 (c0*21+c1*11)/32.

a*21+b*11 有优化的余地:

__inline int blander_internal(unsigned a,unsigned b)
{
b+=a;// b=a+b
a+=b;// a=2*a+b
b+=a;// b=3*a+2*b
a*=9;// a=18*a+9*b
return a+b; // 21*a+11*b;
}

用汇编写也可以. 但是不会比编译器强多少 :)

如果使用 mmx, 则可以考虑一次处理 4 个像素. DXT1 中 4 个像素正好一个字节(一个像素两个bit) 这样可以比较方便的使用查表.

00: c0*2/3+c0*1/3
01: c1*2/3+c1*1/3
10: c0*2/3+c1*1/3
11: c1*2/3+c0*1/3

这样, 就变成了 a * 2/3 + b *1/3 的统一式子, 查表来决定 a 和 b 取 c0 还是 c1
原创粉丝点击