Base64编码解码原理

来源:互联网 发布:sm3算法原理 编辑:程序博客网 时间:2024/05/22 12:40

一、编码规则
      Base64编码的思想是是采用64个基本的ASCII码字符对数据进行重新编码。它将需要编码的数据拆分成字节

数组。以3个字节为一组。按顺序排列24 位数据,再把这24位数据分成4组,即每组6位。再在每组的的最高位前

补两个0凑足一个字节。这样就把一个3字节为一组的数据重新编码成了4个字节。当所要编码的数据的字节数不是

3的整倍数,也就是说在分组时最后一组不够3个字节。这时在最后一组填充1到2个0字节。并在最后编码完成后在

结尾添加1到2个 “=”。

例:将对ABC进行BASE64编码:


1、首先取ABC对应的ASCII码值。A(65)B(66)C(67);
2、再取二进制值A(01000001)B(01000010)C(01000011);
 3、然后把这三个字节的二进制码接起来(010000010100001001000011);
4、 再以6位为单位分成4个数据块,并在最高位填充两个0后形成4个字节的编码后的值,(00010000)(00010100

)(00001001)(00000011),其中蓝色部分为真实数据;
 5、再把这四个字节数据转化成10进制数得(16)(20)(9)(3);
 6、最后根据BASE64给出的64个基本字符表,查出对应的ASCII码字符(Q)(U)(J)(D),这里的值实际就是

数据在字符表中的索引。

注:BASE64字符表:ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/

二、解码规则
      解码过程就是把4个字节再还原成3个字节再根据不同的数据形式把字节数组重新整理成数据。


三、JAVA实现

BASE64和其他相似的编码算法通常用于转换二进制数据为文本数据,其目的是为了简化存储或传输。更具体地说,BASE64算法主要用于转换二进制数据为ASCII字符串格式。Java语言提供了一个非常好的BASE64算法的实现,即Apache Commons Codec工具包。本文将简要地讲述怎样使用BASE64以及它是怎样工作的。

下面我们用BASE64对字符串进行编码:

[java] view plaincopyprint?在CODE上查看代码片派生到我的代码片
  1. import java.io.UnsupportedEncodingException;  
  2. import org.apache.commons.codec.binary.Base64;  
  3.   
  4. public class Base64Test {  
  5.     public static void main(String[] args){  
  6.         String str = "Hello World";  
  7.         try{  
  8.             byte[] encodeBase64 = Base64.encodeBase64(str.getBytes("UTF-8"));  
  9.             System.out.println("RESULT: " + new String(encodeBase64));  
  10.         } catch(UnsupportedEncodingException e){  
  11.             e.printStackTrace();  
  12.         }  
  13.     }  
  14. }  

输出结果为:
[html] view plaincopyprint?在CODE上查看代码片派生到我的代码片
  1. RESULT: SGVsbG8gV29ybGQ=  

上面输出的字符串是“Hello world”字符串的8位二进制值被连接在一起,然后以6位分组。随后每个组都被转换成一个单独的数字并映射到Base64的索引。
[html] view plaincopyprint?在CODE上查看代码片派生到我的代码片
  1. binary  dec Base64  
  2. 010010  18  S  
  3. 000110  6   G  
  4. 010101  21  V  
  5. 101100  44  s  
  6. 011011  27  b  
  7. 000110  6   G  
  8. 111100  60  8  
  9. 100000  32  g  
  10. 010101  29  d  
  11. 110110  54  2  
  12. 111101  61  9  
  13. 110010  50  y  
  14. 011011  27  b  
  15. 000110  6   G  
  16. 010000  16  Q  

注意:字符串最后加上了“=”,其意思表示字符串编码的结束。


参考:http://www.cnblogs.com/yiki/archive/2009/01/18/1377828.html

         http://blog.csdn.net/chszs/article/details/17027535

1 0
原创粉丝点击