BASE64Decoder小解

来源：互联网发布：状态栏美化软件编辑：程序博客网时间：2024/05/01 10:54

Base64 是网络上最常见的用于传输8Bit 字节代码的编码方式之一，大家可以查看RFC2045～RFC2049 ，上面有MIME 的详细规范。

Base64 要求把每三个8Bit 的字节转换为四个6Bit 的字节（3*8 = 4*6 = 24 ），然后把6Bit 再添两位高位0 ，组成四个8Bit 的字节，也就是说，转换后的字符串理论上将要比原来的长1/3 。

这样说会不会太抽象了？不怕，我们来看一个例子：

转换前 aaaaaabb ccccdddd eeffffff
转换后 00aaaaaa 00bbcccc 00ddddee 00ffffff

应该很清楚了吧？上面的三个字节是原文，下面的四个字节是转换后的Base64 编码，其前两位均为0 。

转换后，我们用一个码表来得到我们想要的字符串（也就是最终的Base64 编码），这个表是这样的：（摘自RFC2045 ）

                        Table 1: The Base64 Alphabet

   Value Encoding   Value Encoding   Value Encoding   Value Encoding
          0 A          17 R          34 i          51 z
          1 B          18 S          35 j          52 0
          2 C          19 T          36 k          53 1
          3 D          20 U          37 l          54 2
          4 E          21 V          38 m          55 3
          5 F          22 W          39 n          56 4
          6 G          23 X          40 o          57 5
          7 H          24 Y          41 p          58 6
          8 I          25 Z          42 q          59 7
          9 J          26 a          43 r          60 8
      10 K          27 b          44 s          61 9
      11 L          28 c          45 t          62 +
      12 M          29 d          46 u          63 /
      13 N          30 e          47 v
      14 O          31 f          48 w       (pad) =
      15 P          32 g          49 x
      16 Q          33 h          50 y

让我们再来看一个实际的例子，加深印象！

转换前 10101101 1011 1010 01110110
转换后 00101011 00011011 00101001 00110110
十进制 43 27 41 54
对应码表中的值 r b p 2

所以上面的24 位编码，编码后的Base64 值为 rbp2
解码同理，把 rbq2 的二进制位连接上再重组得到三个8 位值，得出原码。
（解码只是编码的逆过程，在此我就不多说了，另外有关MIME 的RFC 还是有很多的，如果需要详细情况请自行查找。）

用更接近于编程的思维来说，编码的过程是这样的：

第一个字符通过右移2 位获得第一个目标字符的Base64 表位置，根据这个数值取到表上相应的字符，就是第一个目标字符。
然后将第一个字符左移4 位加上第二个字符右移4 位，即获得第二个目标字符。
再将第二个字符左移2 位加上第三个字符右移6 位，获得第三个目标字符。
最后取第三个字符的右6 位即获得第四个目标字符。

在以上的每一个步骤之后，再把结果与 0x3F 进行 AND 位操作，就可以得到编码后的字符了。

可是等等…… 聪明的你可能会问到，原文的字节数量应该是3 的倍数啊，如果这个条件不能满足的话，那该怎么办呢？

我们的解决办法是这样的：原文的字节不够的地方可以用全0 来补足，转换时Base64 编码用= 号来代替。这就是为什么有些Base64 编码会以一个或两个等号结束的原因，但等号最多只有两个。因为：

余数 = 原文字节数 MOD 3

所以余数任何情况下都只可能是0 ，1 ，2 这三个数中的一个。如果余数是0 的话，就表示原文字节数正好是3 的倍数（最理想的情况啦）。如果是1 的话，为了让Base64 编码是4 的倍数，就要补2 个等号；同理，如果是2 的话，就要补1 个等号。
在线转换:http://md5.mmkey.com/base64/