base64编码算法与c语言实现

来源:互联网 发布:计算机模块考试软件 编辑:程序博客网 时间:2024/04/26 07:03
base64是一种以64个可打印字符对二进制数据进行编码的编码算法。base64在对数据进行编码时以三个8位字符型数据为一组,取这三个字符型数据的ASCII码,然后以6位为一组组成4个新的数据,这4个新的数据有6位,所以它的最大值为2^6=64。我们以4个6位数据的十进制数从base64表中得到最终编码后的字符。

Base64 编码表

Value Char Value Char Value Char Value Char 0 A 16 Q 32 g 48 w 1 B 17 R 33 h 49 x 2 C 18 S 34 i 50 y 3 D 19 T 35 j 51 z 4 E 20 U 36 k 52 0 5 F 21 V 37 l 53 1 6 G 22 W 38 m 54 2 7 H 23 X 39 n 55 3 8 I 24 Y 40 o 56 4 9 J 25 Z 41 p 57 5 10 K 26 a 42 q 58 6 11 L 27 b 43 r 59 7 12 M 28 c 44 s 60 8 13 N 29 d 45 t 61 9 14 O 30 e 46 u 62 + 15 P 31 f 47 v 63 /
由于base64编码是以3个字节为一组,再以每6位为一小组分成4个组,所以经过base64编码后的字符串长度是4的倍数.但往往我们进行编码的数据长度并不是3的倍数,这就造成了“编码”后的位数不为4的倍数,比如Brisk共5×8=40字节,以6位为一组可以分为7组,这样“编码”后就有7个字符,但base64编码后的字符长度应该是4的倍数,显然这里就出问题了,那么怎么办呢?前面的不可以抛弃掉,所以就只有“追加”了,所以Brisk经过base64编码后的长度应该是8个字符,而第8个编码后的字符是'=',再比如对单个字符a进行base64编码,由于它的长度不是3的倍数,以3个字节为一组它只能分一组,再以6位为一位它只能分两组,所以经过“编码”后它的长度是2,但base64编码后的个数应该是4的倍数,所以它的长度应该是4,所以在后面补上两个‘=’,由于一个数求余3后有三个不同的结果,0、1、2,所以在对一个数据进行base64进行编码后它的长度为

当进行编码的数据长度是3的倍数时
len=strlen(str)/3*4;
当进行编码的数据长度不是3的倍数时
len=(strlen(str)/3+1)*4;

我们以Brisk这个例子来说明一下base64编码的过程
首先我们以3个字符为一组将Brisk进行分组,此时分为两组Bri sk
然后我们取出这两个分组中每个字节的ASCII码
B:66 r:114 i:105 s:115 k:107
它们对应的二进制数为
B:01000010 r:01110010 i:01101001 s:01110011 k:01101011
我们以6位为一组对每一个3字节分组进行再分组就变成了
010000 100111 001001 101001
所对应的十进制数是
16 39 9 41
对应base64表中的结果是
Q n J p

第二组
011100 110110 101100(不够补0)
所以对就的十进制数是
28 54 44
对应base64表中的结果是
c 2 s

最终结果为QnJpc2s=(因为第二组“编码”后只有三个字节)

解码的过程是一个逆过程,我们将经过编码后的字符按4个字符为一组,然后对照base64表得到相应的十进制数,再将其通过拆分和组合,组成3个8位数据,这个数据就是解码后的数据,下面给一个c语言实现编码和解码的代码.
/*base64.h*/#ifndef _BASE64_H#define _BASE64_H#include <stdlib.h>#include <string.h>unsigned char *base64_encode(unsigned char *str);unsigned char *bae64_decode(unsigned char *code);#endif/*base64.c*/#include "base64.h"unsigned char *base64_encode(unsigned char *str){    long len;    long str_len;    unsigned char *res;    int i,j;//定义base64编码表    unsigned char *base64_table="ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";//计算经过base64编码后的字符串长度    str_len=strlen(str);    if(str_len % 3 == 0)        len=str_len/3*4;    else        len=(str_len/3+1)*4;    res=malloc(sizeof(unsigned char)*len+1);    res[len]='\0';//以3个8位字符为一组进行编码    for(i=0,j=0;i<len-2;j+=3,i+=4)    {        res[i]=base64_table[str[j]>>2]; //取出第一个字符的前6位并找出对应的结果字符        res[i+1]=base64_table[(str[j]&0x3)<<4 | (str[j+1]>>4)]; //将第一个字符的后位与第二个字符的前4位进行组合并找到对应的结果字符        res[i+2]=base64_table[(str[j+1]&0xf)<<2 | (str[j+2]>>6)]; //将第二个字符的后4位与第三个字符的前2位组合并找出对应的结果字符        res[i+3]=base64_table[str[j+2]&0x3f]; //取出第三个字符的后6位并找出结果字符    }    switch(str_len % 3)    {        case 1:            res[i-2]='=';            res[i-1]='=';            break;        case 2:            res[i-1]='=';            break;    }    return res;}unsigned char *base64_decode(unsigned char *code){//根据base64表,以字符找到对应的十进制数据    int table[]={0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,62,0,0,0,63,52,53,54,55,56,57,58,59,60,61,0,0,0,0,0,0,0,0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,0,0,0,0,0,0,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51};    long len;    long str_len;    unsigned char *res;    int i,j;//计算解码后的字符串长度    len=strlen(code);//判断编码后的字符串后是否有=    if(strstr(code,"=="))        str_len=len/4*3-2;    else if(strstr(code,"="))        str_len=len/4*3-1;    else        str_len=len/4;    res=malloc(sizeof(unsigned char)*str_len+1);    res[str_len]='\0';//以4个字符为一位进行解码    for(i=0,j=0;i < len-2;j+=3,i+=4)    {        res[j]=((unsigned char)table[code[i]])<<2 | (((unsigned char)table[code[i+1]])>>4); //取出第一个字符对应base64表的十进制数的前6位与第二个字符对应base64表的十进制数的后2位进行组合        res[j+1]=(((unsigned char)table[code[i+1]])<<4) | (((unsigned char)table[code[i+2]])>>2); //取出第二个字符对应base64表的十进制数的后4位与第三个字符对应bas464表的十进制数的后4位进行组合        res[j+2]=(((unsigned char)table[code[i+2]])<<6) | ((unsigned char)table[code[i+3]]); //取出第三个字符对应base64表的十进制数的后2位与第4个字符进行组合    }    return res;}/*一个测试程序*/#include "base64.h"#include <stdio.h>int main(int argc,char **argv){    if(strcmp(argv[1],"-d") == 0)        printf("%s\n",base64_decode(argv[2]));    else        printf("%s\n",base64_encode(argv[1]));    return 0;}编译gcc -o test test.c base64.c./test BriskQnJpc2s=./test -d QnJpc2s=Brisk

参考
base64编码算法与c语言实现

原创粉丝点击