Java加密解密技术系列之MD5

来源:互联网 发布:圣剑网络之圣剑联盟 编辑:程序博客网 时间:2024/04/28 14:53

 MD5,MD5 属于单向加密算法,是不可逆的加密方式,也就是说,采用了 MD5 加密方式加密之后,就不能对加密的结果进行解密,得到原有的字符串,这是不可以的。


在我们的生活中,MD5 用到的还是很广泛的。在说 MD5 之前,首先来了解一下单向加密算法都有哪些。当然,MD5 是其中之一,除此之外还有,SHA,HMAC 等这几种算法。不过,今天这篇文章,我们只介绍 MD5,至于 SHA 和 HMAC 在后续的文章中会陆续的介绍。


正文


MD5,全称为“Message Digest Algorithm 5”,中文名“消息摘要算法第五版”,它是计算机安全领域广泛使用的一种散列函数,用以提供消息的完整性保护。严格来说,它是一种摘要算法,是确保信息完整性的。不过,在某种意义上来说,也可以算作一种加密算法。

MD5 算法具有很多特点:
  • 压缩性:任意长度的数据,算出的MD5值长度都是固定的。(32位的字符串)
  • 容易计算:从原数据计算出MD5值很容易。
  • 抗修改性:对原数据进行任何改动,哪怕只修改1个字节,所得到的MD5值都有很大区别。
  • 弱抗碰撞:已知原数据和其MD5值,想找到一个具有相同MD5值的数据(即伪造数据)是非常困难的。
  • 强抗碰撞:想找到两个不同的数据,使它们具有相同的MD5值,是非常困难的。

MD5 的作用是让大容量信息在用数字签名软件签署私人密钥前被"压缩"成一种保密的格式(就是把一个任意长度的字节串变换成一定长的十六进制数字串)。

MD5 其实在我们生活中是很常用的,似乎你并没有注意到,当你下载了一个镜像之后,你会发现下载页面还提供了一组 MD5 值,那么这组 MD5 值是用来做什么的呢?了解了 MD5 的作用之后,你就不难想到,MD5 是用来验证文件的一致性的,当你下载好镜像之后,你需要对该镜像做一次 MD5 的校验,得到的 MD5 值与下载页面提供的 MD5 值进行对比,以此来验证该镜像是否被篡改。

为什么 MD5 就可以进行一致性校验呢?

其实,MD5 就和人的指纹一样,每个人的指纹都是唯一的,而文件的 MD5 值也是唯一的。至于为什么会这样呢?下面我们看一下 MD5 的工作原理。

对 MD5 算法简要的叙述可以为:MD5 以 512 位分组来处理输入的信息,且每一分组又被划分为 16 个 32 位子分组,经过了一系列的处理后,算法的输出由四个 32 位分组组成,将这四个 32 位分组级联后将生成一个 128 位散列值。

总体流程如下图所示, 表示第 i 个分组,每次的运算都由前一轮的 128 位结果值和第 i 块 512 bit 值进行运算。



填充

在 MD5 算法中,首先需要对信息进行填充,使其位长对 512 求余的结果等于 448,并且填充必须进行,即使其位长对 512 求余的结果等于 448。因此,信息的位长(Bits Length)将被扩展至 N * 512 + 448,N 为一个非负整数,N 可以是零。

填充的方法如下:
1) 在信息的后面填充一个 1 和无数个 0,直到满足上面的条件时才停止用 0 对信息的填充。
2) 在这个结果后面附加一个以 64 位二进制表示的填充前信息长度(单位为Bit),如果二 进制表示的填充前信息长度超过 64 位,则取低 64 位。

经过这两步的处理,信息的位长 = N * 512 + 448 + 64 = (N + 1)* 512,即长度恰好是 512 的整数倍。这样做的原因是为满足后面处理中对信息长度的要求。

初始化变量

初始的 128 位值为初试链接变量,这些参数用于第一轮的运算,以大端字节序来表示,他们分别为: A = 0x01234567,B = 0x89ABCDEF,C = 0xFEDCBA98,D = 0x76543210。

(每一个变量给出的数值是高字节存于内存低地址,低字节存于内存高地址,即大端字节序。在程序中变量 A、B、C、D 的值分别为0x67452301,0xEFCDAB89,0x98BADCFE,0x10325476)

处理分组数据

每一分组的算法流程如下:

第一分组需要将上面四个链接变量复制到另外四个变量中:A 到 a,B 到 b,C 到 c,D 到 d。从第二分组开始的变量为上一分组的运算结果,即 A = a, B = b, C = c, D = d。

主循环有四轮,每轮循环都很相似。第一轮进行 16 次操作。每次操作对 a、b、c 和 d 中的其中三个作一次非线性函数运算,然后将所得结果加上第四个变量,文本的一个子分组和一个常数。再将所得结果向左环移一个不定的数,并加上 a、b、c 或 d 中之一。最后用该结果取代 a、b、c 或 d 中之一。

输出


最后的输出是 a、b、c 和 d 的级联。


代码


这里提供一个 Java 版本的实现,不过需要说明的一点是,这个 Java 实现对于英文的 MD5 是没有问题的,但对于中文会有点问题,因此,推荐只作为学习为目的来参考。如果是项目中的生产需要,请选择 jdk 中自带的 MD5 加密函数。

[java] view plaincopy在CODE上查看代码片派生到我的代码片
  1. package com.sica.md5.impl;  
  2.   
  3. /** 
  4.  * Created by xiang.li on 2015/2/26. 
  5.  */  
  6. public class MD5 {  
  7.     /** 
  8.      * 单例 
  9.      */  
  10.     private static MD5 instance;  
  11.   
  12.     /** 
  13.      * 四个链接变量 
  14.      */  
  15.     private final int A = 0x67452301;  
  16.     private final int B = 0xefcdab89;  
  17.     private final int C = 0x98badcfe;  
  18.     private final int D = 0x10325476;  
  19.   
  20.     /** 
  21.      * ABCD的临时变量 
  22.      */  
  23.     private int Atemp;  
  24.     private int Btemp;  
  25.     private int Ctemp;  
  26.     private int Dtemp;  
  27.   
  28.     /** 
  29.      * 常量ti 
  30.      * 公式:floor(abs(sin(i+1))×(2pow32) 
  31.      */  
  32.     private final int[] K = {  
  33.                 0xd76aa4780xe8c7b7560x242070db0xc1bdceee,  
  34.                 0xf57c0faf0x4787c62a0xa83046130xfd4695010x698098d8,  
  35.                 0x8b44f7af0xffff5bb10x895cd7be0x6b9011220xfd987193,  
  36.                 0xa679438e0x49b408210xf61e25620xc040b3400x265e5a51,  
  37.                 0xe9b6c7aa0xd62f105d0x024414530xd8a1e6810xe7d3fbc8,  
  38.                 0x21e1cde60xc33707d60xf4d50d870x455a14ed0xa9e3e905,  
  39.                 0xfcefa3f80x676f02d90x8d2a4c8a0xfffa39420x8771f681,  
  40.                 0x6d9d61220xfde5380c0xa4beea440x4bdecfa90xf6bb4b60,  
  41.                 0xbebfbc700x289b7ec60xeaa127fa0xd4ef30850x04881d05,  
  42.                 0xd9d4d0390xe6db99e50x1fa27cf80xc4ac56650xf4292244,  
  43.                 0x432aff970xab9423a70xfc93a0390x655b59c30x8f0ccc92,  
  44.                 0xffeff47d0x85845dd10x6fa87e4f0xfe2ce6e00xa3014314,  
  45.                 0x4e0811a10xf7537e820xbd3af2350x2ad7d2bb0xeb86d391  
  46.     };  
  47.   
  48.     /** 
  49.      * 向左位移数,计算方法未知 
  50.      */  
  51.     private final int[] s = {  
  52.             7121722712172271217227,  
  53.             121722591420591420591420591420,  
  54.             4111623411162341116234111623610,  
  55.             1521610152161015216101521  
  56.     };  
  57.   
  58.     /** 
  59.      * 私有构造函数 
  60.      */  
  61.     private MD5() {  
  62.   
  63.     }  
  64.   
  65.     /** 
  66.      * 单例模式 
  67.      * @return 
  68.      */  
  69.     public static MD5 getInstance() {  
  70.         if (instance == null) {  
  71.             instance = new MD5();  
  72.         }  
  73.         return instance;  
  74.     }  
  75.   
  76.     /** 
  77.      * 初始化函数 
  78.      */  
  79.     private void init() {  
  80.         Atemp = A;  
  81.         Btemp = B;  
  82.         Ctemp = C;  
  83.         Dtemp = D;  
  84.     }  
  85.   
  86.     /** 
  87.      * 移动一定位数 
  88.      * @param a 
  89.      * @param s 
  90.      * @return 
  91.      */  
  92.     private int shift(int a, int s) {  
  93.         return (a << s) | (a >>> (32 - s)); // 右移的时候,高位一定要补零,而不是补充符号位  
  94.     }  
  95.   
  96.     /** 
  97.      * 主循环 
  98.      * @param M 
  99.      */  
  100.     private void mainLoop(int[] M) {  
  101.         int F;  
  102.         int g;  
  103.         int a = Atemp;  
  104.         int b = Btemp;  
  105.         int c = Ctemp;  
  106.         int d = Dtemp;  
  107.   
  108.         for (int i = 0; i < 64; i++) {  
  109.             if (i < 16) {  
  110.                 F = (b & c) | ((~b) & d);  
  111.                 g = i;  
  112.             }else if (i < 32) {  
  113.                 F = (d & b) | ((~d) & c);  
  114.                 g = (5 * i + 1) % 16;  
  115.             }else if (i < 48) {  
  116.                 F = b ^ c ^ d;  
  117.                 g = (3 * i + 5) % 16;  
  118.             } else {  
  119.                 F = c ^ (b | (~d));  
  120.                 g = (7 * i) % 16;  
  121.             }  
  122.   
  123.             int tmp = d;  
  124.             d = c;  
  125.             c = b;  
  126.             b = b + shift(a + F + K[i] + M[g], s[i]);  
  127.             a = tmp;  
  128.         }  
  129.   
  130.         Atemp += a;  
  131.         Btemp += b;  
  132.         Ctemp += c;  
  133.         Dtemp += d;  
  134.     }  
  135.   
  136.     /** 
  137.      * 填充函数 
  138.      * 处理后应满足bits≡448(mod512),字节就是bytes≡56(mode64) 
  139.      * 填充方式为先加一个0,其它位补零 
  140.      * 最后加上64位的原来长度 
  141.      * @param str 
  142.      * @return 
  143.      */  
  144.     private int[] add(String str) {  
  145.         int num = ((str.length() + 8) / 64) + 1;    // 以512位,64个字节为一组  
  146.         int[] strByte = new int[num * 16];  // 64/4=16,所以有16个整数  
  147.   
  148.         for (int i = 0; i < num * 16; i++) {  
  149.             // 全部初始化为0  
  150.             strByte[i] = 0;  
  151.         }  
  152.   
  153.         int j;  
  154.         for (j = 0; j < str.length(); j++) {  
  155.             strByte[j >> 2] |= str.charAt(j) << ((j % 4) * 8);  // 一个整数存储四个字节,小端序  
  156.         }  
  157.         strByte[j >> 2] |= 0x80 << ((j % 4) * 8);   // 尾部添加1  
  158.   
  159.         // 添加原长度,长度指位的长度,所以要乘8,然后是小端序,所以放在倒数第二个,这里长度只用了32位  
  160.         strByte[num * 16 - 2] = str.length() * 8;  
  161.   
  162.         return strByte;  
  163.     }  
  164.   
  165.     /** 
  166.      * 调用函数 
  167.      * @param source 原始字符串 
  168.      * @return 
  169.      */  
  170.     public String getMD5(String source) {  
  171.         // 初始化  
  172.         init();  
  173.         int[] strByte = add(source);  
  174.         for (int i = 0; i < strByte.length / 16; i += 16) {  
  175.             int[] num = new int[16];  
  176.             for (int j = 0; j < 16; j++) {  
  177.                 num[j] = strByte[i * 16 + j];  
  178.             }  
  179.             mainLoop(num);  
  180.         }  
  181.         return changeHex(Atemp) + changeHex(Btemp) + changeHex(Ctemp) + changeHex(Dtemp);  
  182.     }  
  183.   
  184.     /** 
  185.      * 整数变成16进制字符串 
  186.      * @param a 整数 
  187.      * @return 
  188.      */  
  189.     private String changeHex(int a) {  
  190.         String str="";  
  191.         String tmp = "";  
  192.         for(int i=0;i<4;i++) {  
  193.             tmp = Integer.toHexString(((a >> i * 8) % (1 << 8)) & 0xff);  
  194.             if (tmp.length() < 2) {  
  195.                 tmp = "0" + tmp;  
  196.             }  
  197.             str += tmp;  
  198.         }  
  199.         return str;  
  200.     }  
  201.   
  202.     /** 
  203.      * 测试方法 
  204.      * @param args 
  205.      */  
  206.     public static void main(String[] args) {  
  207.         String str = MD5.getInstance().getMD5("");  
  208.         String str1 = MD5.getInstance().getMD5("123");  
  209.         System.out.println(str);  
  210.         System.out.println("d41d8cd98f00b204e9800998ecf8427e");  
  211.         System.out.println(str1);  
  212.         System.out.println("202cb962ac59075b964b07152d234b70");  
  213.     }  
  214. }


结束语


或许你经常见到 MD5,但你从来没有注意过,到底什么才是 MD5。也或许你知道什么是 MD5,但或许你并不了解 MD5 是作何用的。那么,从今天起,从你读完这篇博客起,我相信,以后再见到 MD5 的时候,你肯定会对它印象深刻,再下载文件的时候,也会对它进行 MD5 的一致性校验。那么,我就可以说,我的这篇文章还是起到了一丁点的作用。
0 0
原创粉丝点击