MD5

来源:互联网 发布:super java怎么理解 编辑:程序博客网 时间:2024/05/21 00:17

MD5的全称是message-digest algorithm 5(信息-摘要算法)MD5是一个在国内外有着广泛的应用的杂凑函数算法,它曾一度被认为是非常安全的。HASH函数,又称杂凑函数,是在信息安全领域有广泛和重要应用的密码算法,它有一种类似于指纹的应用。在网络安全协议中,杂凑函数用来处理电子签名,将冗长的签名文件压缩为一段独特的数字信息,像指纹鉴别身份一样保证原来数字签名文件的合法性和安全性。在前面提到的SHA-1和MD5都是目前最常用的杂凑函数。经过这些算法的处理,原始信息即使只更动一个字母,对应的压缩信息也会变为截然不同的“指纹”,这就保证了经过处理信息的唯一性。为电子商务等提供了数字认证的可能性。 安全的杂凑函数在设计时必须满足两个要求:其一是寻找两个输入得到相同的输出值在计算上是不可行的,这就是我们通常所说的抗碰撞的;其二是找一个输入,能得到给定的输出在计算上是不可行的,即不可从结果推导出它的初始状态。现在使用的重要计算机安全协议,如SSL,PGP都用杂凑函数来进行签名,一旦找到两个文件可以产生相同的压缩值,就可以伪造签名,给网络安全领域带来巨大隐患。


算法的应用

  md5的典型应用是对一段信息(message)产生信息摘要(message-digest),以防止被篡改。比如,在unix下有很多软件在下载的时候都有一个文件名相同,文件扩展名为.md5的文件,在这个文件中通常只有一行文本,大致结构如:

   md5 (tanajiya.tar.gz) = 0ca175b9c0f726a831d895e269332461

  这就是tanajiya.tar.gz文件的数字签名。md5将整个文件当作一个大文本信息,通过其不可逆的字符串变换算法,产生了这个唯一的md5信息摘要。如果在以后传播这个文件的过程中,无论文件的内容发生了任何形式的改变(包括人为修改或者下载过程中线路不稳定引起的传输错误等),只要你对这个文件重新计算md5时就会发现信息摘要不相同,由此可以确定你得到的只是一个不正确的文件。如果再有一个第三方的认证机构,用md5还可以防止文件作者的"抵赖",这就是所谓的数字签名应用。

  md5还广泛用于加密和解密技术上。比如在unix系统中用户的密码就是以md5(或其它类似的算法)经加密后存储在文件系统中。当用户登录的时候,系统把用户输入的密码计算成md5值,然后再去和保存在文件系统中的md5值进行比较,进而确定输入的密码是否正确。通过这样的步骤,系统在并不知道用户密码的明码的情况下就可以确定用户登录系统的合法性。这不但可以避免用户的密码被具有系统管理员权限的用户知道,而且还在一定程度上增加了密码被破解的难度。

  正是因为这个原因,现在被黑客使用最多的一种破译密码的方法就是一种被称为"跑字典"的方法。有两种方法得到字典,一种是日常搜集的用做密码的字符串表,另一种是用排列组合方法生成的,先用md5程序计算出这些字典项的md5值,然后再用目标的md5值在这个字典中检索。我们假设密码的最大长度为8位字节(8 bytes),同时密码只能是字母和数字,共26+26+10=62个字符,排列组合出的字典的项数则是p(62,1)+p(62,2).+p(62,8),那也已经是一个很天文的数字了,存储这个字典就需要tb级的磁盘阵列,而且这种方法还有一个前提,就是能获得目标账户的密码md5值的情况下才可以。这种加密技术被广泛的应用于unix系统中,这也是为什么unix系统比一般操作系统更为坚固一个重要原因。

  算法描述

  对md5算法简要的叙述可以为:md5512位分组来处理输入的信息,且每一分组又被划分为1632位子分组,经过了一系列的处理后,算法的输出由四个32位分组组成,将这四个32位分组级联后将生成一个128位散列值。

  在MD5算法中,首先需要对信息进行填充,使其字节长度对512求余的结果等于448。因此,信息的字节长度(bits length)将被扩展至n*512+448,即n*64+56个字节(bytes),n为一个正整数。填充的方法如下,在信息的后面填充一个1和无数个0,直到满足上面的条件时才停止用0对信息的填充。然后,在在这个结果后面附加一个以64位二进制表示的填充前信息长度。经过这两步的处理,现在的信息字节长度=n*512+448+64=(n+1)*512,即长度恰好是512的整数倍。这样做的原因是为满足后面处理中对信息长度的要求。

  MD5中有四个32位被称作链接变量(chaining variable)的整数参数,他们分别为:a=0x01234567b=0x89abcdefc=0xfedcba98d=0x76543210  

  当设置好这四个链接变量后,就开始进入算法的四轮循环运算。循环的次数是信息中512位信息分组的数目。

  将上面四个链接变量复制到另外四个变量中:aabbccdd

  主循环有四轮(md4只有三轮),每轮循环都很相似。第一轮进行16次操作。每次操作对abcd中的其中三个作一次非线性函数运算,然后将所得结果加上第四个变量,文本的一个子分组和一个常数。再将所得结果向右环移一个不定的数,并加上abcd中之一。最后用该结果取代abcd中之一。

以一下是每次操作中用到的四个非线性函数(每轮一个)。

   f(x,y,z) =(x&y)|((~x)&z)

   g(x,y,z) =(x&z)|(y&(~z))

   h(x,y,z) =x^y^z

   i(x,y,z)=y^(x|(~z))

   (&是与,|是或,~是非,^是异或)

  这四个函数的说明:如果xyz的对应位是独立和均匀的,那么结果的每一位也应是独立和均匀的。

f是一个逐位运算的函数。即,如果x,那么y,否则z。函数h是逐位奇偶操作符。

  假设mj表示消息的第j个子分组(从015),

       ff(a,b,c,d,mj,s,ti)表示a=b+((a+(f(b,c,d)+mj+ti)

       gg(a,b,c,d,mj,s,ti)表示a=b+((a+(g(b,c,d)+mj+ti)

       hh(a,b,c,d,mj,s,ti)表示a=b+((a+(h(b,c,d)+mj+ti)

       ii(a,b,c,d,mj,s,ti)表示a=b+((a+(i(b,c,d)+mj+ti)

  这四轮(64步)是:

  第一轮

   ff(a,b,c,d,m0,7,0xd76aa478)

   ff(d,a,b,c,m1,12,0xe8c7b756)

   ff(c,d,a,b,m2,17,0x242070db)

ff(b,c,d,a,m3,22,0xc1bdceee)

   ff(a,b,c,d,m4,7,0xf57c0faf)

   ff(d,a,b,c,m5,12,0x4787c62a)

   ff(c,d,a,b,m6,17,0xa8304613)

   ff(b,c,d,a,m7,22,0xfd469501)

   ff(a,b,c,d,m8,7,0x698098d8)

   ff(d,a,b,c,m9,12,0x8b44f7af)

   ff(c,d,a,b,m10,17,0xffff5bb1)

   ff(b,c,d,a,m11,22,0x895cd7be)

   ff(a,b,c,d,m12,7,0x6b901122)

   ff(d,a,b,c,m13,12,0xfd987193)

   ff(c,d,a,b,m14,17,0xa679438e)

   ff(b,c,d,a,m15,22,0x49b40821)

  第二轮

   gg(a,b,c,d,m1,5,0xf61e2562)

   gg(d,a,b,c,m6,9,0xc040b340)

   gg(c,d,a,b,m11,14,0x265e5a51)

   gg(b,c,d,a,m0,20,0xe9b6c7aa)

   gg(a,b,c,d,m5,5,0xd62f105d)

   gg(d,a,b,c,m10,9,0x02441453)

   gg(c,d,a,b,m15,14,0xd8a1e681)

   gg(b,c,d,a,m4,20,0xe7d3fbc8)

   gg(a,b,c,d,m9,5,0x21e1cde6)

   gg(d,a,b,c,m14,9,0xc33707d6)

   gg(c,d,a,b,m3,14,0xf4d50d87)

   gg(b,c,d,a,m8,20,0x455a14ed)

   gg(a,b,c,d,m13,5,0xa9e3e905)

   gg(d,a,b,c,m2,9,0xfcefa3f8)

   gg(c,d,a,b,m7,14,0x676f02d9)

   gg(b,c,d,a,m12,20,0x8d2a4c8a)

  第三轮

   hh(a,b,c,d,m5,4,0xfffa3942)

   hh(d,a,b,c,m8,11,0x8771f681)

   hh(c,d,a,b,m11,16,0x6d9d6122)

   hh(b,c,d,a,m14,23,0xfde5380c)

   hh(a,b,c,d,m1,4,0xa4beea44)

   hh(d,a,b,c,m4,11,0x4bdecfa9)

   hh(c,d,a,b,m7,16,0xf6bb4b60)

   hh(b,c,d,a,m10,23,0xbebfbc70)

   hh(a,b,c,d,m13,4,0x289b7ec6)

   hh(d,a,b,c,m0,11,0xeaa127fa)

   hh(c,d,a,b,m3,16,0xd4ef3085)

   hh(b,c,d,a,m6,23,0x04881d05)

   hh(a,b,c,d,m9,4,0xd9d4d039)

   hh(d,a,b,c,m12,11,0xe6db99e5)

   hh(c,d,a,b,m15,16,0x1fa27cf8)

   hh(b,c,d,a,m2,23,0xc4ac5665)

  第四轮

   ii(a,b,c,d,m0,6,0xf4292244)

   ii(d,a,b,c,m7,10,0x432aff97)

   ii(c,d,a,b,m14,15,0xab9423a7)

   ii(b,c,d,a,m5,21,0xfc93a039)

   ii(a,b,c,d,m12,6,0x655b59c3)

   ii(d,a,b,c,m3,10,0x8f0ccc92)

   ii(c,d,a,b,m10,15,0xffeff47d)

   ii(b,c,d,a,m1,21,0x85845dd1)

   ii(a,b,c,d,m8,6,0x6fa87e4f)

   ii(d,a,b,c,m15,10,0xfe2ce6e0)

   ii(c,d,a,b,m6,15,0xa3014314)

   ii(b,c,d,a,m13,21,0x4e0811a1)

   ii(a,b,c,d,m4,6,0xf7537e82)

   ii(d,a,b,c,m11,10,0xbd3af235)

   ii(c,d,a,b,m2,15,0x2ad7d2bb)

   ii(b,c,d,a,m9,21,0xeb86d391)

  常数ti可以如下选择:

  在第i步中,ti4294967296*abs(sin(i))的整数部分,i的单位是弧度。(4294967296等于232次方)

所有这些完成之后,将abcd分别加上abcd。然后用下一分组数据继续运行算法,最后的输出是abcd的级联。

  当你按照我上面所说的方法实现md5算法以后,你可以用以下几个信息对你做出来的程序作一个简单的测试,看看程序有没有错误。

  md5 ("") = d41d8cd98f00b204e9800998ecf8427e

  md5 ("a") = 0cc175b9c0f1b6a831c399e269772661

  md5 ("abc") = 900150983cd24fb0d6963f7d28e17f72

  md5 ("message digest") = f96b697d7cb7938d525a2f31aaf161d0

  md5 ("abcdefghijklmnopqrstuvwxyz") = c3fcd3d76192e4007dfb496cca67e13b

 md5("ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789") =

d174ab98d277d9f5a5611c2c9f419d9f

md5("12345678901234567890123456789012345678901234567890123456789012345678901234567890") = 57edf4a22be3c955ac49da2e2107b67a

#includetypedef struct {    unsigned int state[4];         unsigned int count[2];         unsigned char buffer[64];     } MD5Context; void MD5_Init(MD5Context * context);void MD5_Update(MD5Context * context, unsigned char * buf, int len);void MD5_Final(MD5Context * context, unsigned char digest[16]);#define S11 7#define S12 12#define S13 17#define S14 22#define S21 5#define S22 9#define S23 14#define S24 20#define S31 4#define S32 11#define S33 16#define S34 23#define S41 6#define S42 10#define S43 15#define S44 21 static unsigned char PADDING[64] ={    0x80, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,    0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,    0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0};#define F(x, y, z) (((x) & (y)) | ((~x) & (z)))#define G(x, y, z) (((x) & (z)) | ((y) & (~z)))#define H(x, y, z) ((x) ^ (y) ^ (z))#define I(x, y, z) ((y) ^ ((x) | (~z))) #define ROTATE_LEFT(x, n) (((x) << (n)) | ((x) >> (32-(n)))) #define FF(a, b, c, d, x, s, ac)          \    {                       \    (a) += F((b), (c), (d)) + (x) + (unsigned int)(ac);  \    (a) = ROTATE_LEFT((a), (s));           \    (a) += (b);                 \    } #define GG(a, b, c, d, x, s, ac)          \    {                       \    (a) += G((b), (c), (d)) + (x) + (unsigned int)(ac);  \    (a) = ROTATE_LEFT((a), (s));           \    (a) += (b);                 \    } #define HH(a, b, c, d, x, s, ac)          \    {                       \    (a) += H((b), (c), (d)) + (x) + (unsigned int)(ac);  \    (a) = ROTATE_LEFT((a), (s));           \    (a) += (b);                 \    } #define II(a, b, c, d, x, s, ac)          \    {                       \    (a) += I((b), (c), (d)) + (x) + (unsigned int)(ac);  \    (a) = ROTATE_LEFT((a), (s));           \    (a) += (b);                 \    }static void MD5_Encode(unsigned char * output, unsigned int * input, int len){    unsigned int i, j;     for (i = 0, j = 0; j < len; i++, j += 4)    {       output[j] = (unsigned char) (input[i] & 0xff);       output[j + 1] = (unsigned char) ((input[i] >> 8) & 0xff);       output[j + 2] = (unsigned char) ((input[i] >> 16) & 0xff);       output[j + 3] = (unsigned char) ((input[i] >> 24) & 0xff);    }} static void MD5_Decode(unsigned int * output, unsigned char * input, int len){    unsigned int i, j;     for (i = 0, j = 0; j < len; i++, j += 4)    {       output[i] = ((unsigned int) input[j]) |           (((unsigned int) input[j + 1]) << 8) |           (((unsigned int) input[j + 2]) << 16) |           (((unsigned int) input[j + 3]) << 24);    }} static void MD5_Transform(unsigned int state[4], unsigned char block[64]){    unsigned int a = state[0], b = state[1], c = state[2], d = state[3], x[16];     MD5_Decode(x, block, 64);     /* Round 1 */    FF(a, b, c, d, x[0], S11, 0xd76aa478);    /* 1 */    FF(d, a, b, c, x[1], S12, 0xe8c7b756);    /* 2 */    FF(c, d, a, b, x[2], S13, 0x242070db);    /* 3 */    FF(b, c, d, a, x[3], S14, 0xc1bdceee);    /* 4 */    FF(a, b, c, d, x[4], S11, 0xf57c0faf);    /* 5 */    FF(d, a, b, c, x[5], S12, 0x4787c62a);    /* 6 */    FF(c, d, a, b, x[6], S13, 0xa8304613);    /* 7 */    FF(b, c, d, a, x[7], S14, 0xfd469501);    /* 8 */    FF(a, b, c, d, x[8], S11, 0x698098d8);    /* 9 */    FF(d, a, b, c, x[9], S12, 0x8b44f7af);    /* 10 */    FF(c, d, a, b, x[10], S13, 0xffff5bb1);   /* 11 */    FF(b, c, d, a, x[11], S14, 0x895cd7be);   /* 12 */    FF(a, b, c, d, x[12], S11, 0x6b901122);   /* 13 */    FF(d, a, b, c, x[13], S12, 0xfd987193);   /* 14 */    FF(c, d, a, b, x[14], S13, 0xa679438e);   /* 15 */    FF(b, c, d, a, x[15], S14, 0x49b40821);   /* 16 */     /* Round 2 */    GG(a, b, c, d, x[1], S21, 0xf61e2562);    /* 17 */    GG(d, a, b, c, x[6], S22, 0xc040b340);    /* 18 */    GG(c, d, a, b, x[11], S23, 0x265e5a51);   /* 19 */    GG(b, c, d, a, x[0], S24, 0xe9b6c7aa);    /* 20 */    GG(a, b, c, d, x[5], S21, 0xd62f105d);    /* 21 */    GG(d, a, b, c, x[10], S22, 0x2441453);    /* 22 */    GG(c, d, a, b, x[15], S23, 0xd8a1e681);   /* 23 */    GG(b, c, d, a, x[4], S24, 0xe7d3fbc8);    /* 24 */    GG(a, b, c, d, x[9], S21, 0x21e1cde6);    /* 25 */    GG(d, a, b, c, x[14], S22, 0xc33707d6);   /* 26 */    GG(c, d, a, b, x[3], S23, 0xf4d50d87);    /* 27 */    GG(b, c, d, a, x[8], S24, 0x455a14ed);    /* 28 */    GG(a, b, c, d, x[13], S21, 0xa9e3e905);   /* 29 */    GG(d, a, b, c, x[2], S22, 0xfcefa3f8);    /* 30 */    GG(c, d, a, b, x[7], S23, 0x676f02d9);    /* 31 */    GG(b, c, d, a, x[12], S24, 0x8d2a4c8a);   /* 32 */     /* Round 3 */    HH(a, b, c, d, x[5], S31, 0xfffa3942);    /* 33 */    HH(d, a, b, c, x[8], S32, 0x8771f681);    /* 34 */    HH(c, d, a, b, x[11], S33, 0x6d9d6122);   /* 35 */    HH(b, c, d, a, x[14], S34, 0xfde5380c);   /* 36 */    HH(a, b, c, d, x[1], S31, 0xa4beea44);    /* 37 */    HH(d, a, b, c, x[4], S32, 0x4bdecfa9);    /* 38 */    HH(c, d, a, b, x[7], S33, 0xf6bb4b60);    /* 39 */    HH(b, c, d, a, x[10], S34, 0xbebfbc70);   /* 40 */    HH(a, b, c, d, x[13], S31, 0x289b7ec6);   /* 41 */    HH(d, a, b, c, x[0], S32, 0xeaa127fa);    /* 42 */    HH(c, d, a, b, x[3], S33, 0xd4ef3085);    /* 43 */    HH(b, c, d, a, x[6], S34, 0x4881d05); /* 44 */    HH(a, b, c, d, x[9], S31, 0xd9d4d039);    /* 45 */    HH(d, a, b, c, x[12], S32, 0xe6db99e5);   /* 46 */    HH(c, d, a, b, x[15], S33, 0x1fa27cf8);   /* 47 */    HH(b, c, d, a, x[2], S34, 0xc4ac5665);    /* 48 */     /* Round 4 */    II(a, b, c, d, x[0], S41, 0xf4292244);    /* 49 */    II(d, a, b, c, x[7], S42, 0x432aff97);    /* 50 */    II(c, d, a, b, x[14], S43, 0xab9423a7);   /* 51 */    II(b, c, d, a, x[5], S44, 0xfc93a039);    /* 52 */    II(a, b, c, d, x[12], S41, 0x655b59c3);   /* 53 */    II(d, a, b, c, x[3], S42, 0x8f0ccc92);    /* 54 */    II(c, d, a, b, x[10], S43, 0xffeff47d);   /* 55 */    II(b, c, d, a, x[1], S44, 0x85845dd1);    /* 56 */    II(a, b, c, d, x[8], S41, 0x6fa87e4f);    /* 57 */    II(d, a, b, c, x[15], S42, 0xfe2ce6e0);   /* 58 */    II(c, d, a, b, x[6], S43, 0xa3014314);    /* 59 */    II(b, c, d, a, x[13], S44, 0x4e0811a1);   /* 60 */    II(a, b, c, d, x[4], S41, 0xf7537e82);    /* 61 */    II(d, a, b, c, x[11], S42, 0xbd3af235);   /* 62 */    II(c, d, a, b, x[2], S43, 0x2ad7d2bb);    /* 63 */    II(b, c, d, a, x[9], S44, 0xeb86d391);    /* 64 */     state[0] += a;    state[1] += b;    state[2] += c;    state[3] += d;     memset((char *) x, 0, sizeof(x));} void MD5_Init(MD5Context * context){    context->count[0] = context->count[1] = 0;     context->state[0] = 0x67452301;    context->state[1] = 0xefcdab89;    context->state[2] = 0x98badcfe;    context->state[3] = 0x10325476;} void MD5_Update(MD5Context * context, unsigned char * buf, int len){    unsigned int i, index, partLen;     index = (unsigned int) ((context->count[0] >> 3) & 0x3F);     if ((context->count[0] += ((unsigned int) len << 3)) < ((unsigned int) len << 3))    context->count[1]++;    context->count[1] += ((unsigned int) len >> 29);     partLen = 64 - index;     if (len >= partLen)    {       memcpy((char *) &context->buffer[index], (char *) buf, partLen);       MD5_Transform(context->state, context->buffer);        for (i = partLen; i + 63 < len; i += 64)           MD5_Transform(context->state, &buf[i]);        index = 0;    }    else    {        i = 0;    }     memcpy((char *) &context->buffer[index], (char *) &buf[i], len - i);} void MD5_Final(MD5Context * context, unsigned char digest[16]){    unsigned char bits[8];    unsigned int index, padLen;     MD5_Encode(bits, context->count, 8);     index = (unsigned int) ((context->count[0] >> 3) & 0x3f);    padLen = (index < 56) ? (56 - index) : (120 - index);    MD5_Update(context, PADDING, padLen);     MD5_Update(context, bits, 8);     MD5_Encode(digest, context->state, 16);     memset((char *) context, 0, sizeof(*context));}void MD5_File (char * filename){    FILE *file;    MD5Context context;    unsigned char buff[16];    int i,len;    unsigned char buffer[0x0400];     if (!(file = fopen (filename, "rb")))       printf ("%s can't be opened\n", filename);    else    {       MD5_Init (&context);       while (len = fread (buffer, 1, 1024, file))           MD5_Update (&context, buffer, len);       MD5_Final(&context,buff);       fclose (file);       for(i=0;i<16;i++)       {           printf("%x",(buff[i] & 0xF0)>>4);           printf("%x",buff[i] & 0x0F);       }       printf("\n");    }}int main(){    int i =0,j,len,startTime,endTime;    MD5Context context;    unsigned char buff[16];       char * str1 = "";    char * str2 = "abc";    char * str3 = "message digest";    char * str4 = "abcdefghijklmnopqrstuvwxyz";    char * str5 = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789";    char * str6 = "12345678901234567890123456789012345678901234567890123456789012345678901234567890";       char str[7][100] =    {       "",       "a",       "abc",       "message digest",       "abcdefghijklmnopqrstuvwxyz",       "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789",       "12345678901234567890123456789012345678901234567890123456789012345678901234567890"    };    for(i=0;i<6;i++)    {       len = strlen(str[i]);       MD5_Init(&context);       MD5_Update(&context,(unsigned char *)str[i], len);       MD5_Final(&context,buff);       printf("MD5(\"%s\") = \n",str[i]);       for(j=0;j<16;j++)       {           printf("%x",(buff[j] & 0xF0)>>4);           printf("%x",buff[j] & 0x0F);       }       printf("\n***********************************************************\n");    }    printf("Wating...\n");    MD5_File("00.dat");    system("pause");    return 0;}


0 0
原创粉丝点击