GBK和UTF-8的区别与相互转换

来源:互联网 发布:用c语言写九九乘法表 编辑:程序博客网 时间:2024/05/16 05:54

GBK和UTF-8的区别与相互转换

简介

GBK编码:是指中国的中文字符,其实它包含了简体中文与繁体中文字符,另外还有一种字符“gb2312”,这种字符仅能存储简体中文字符。
UTF-8编码:它是一种全国家通过的一种编码,如果你的网站涉及到多个国家的语言,那么建议你选择UTF-8编码。
GBK和UTF8有什么区别?
UTF8编码格式很强大,支持所有国家的语言,正是因为它的强大,才会导致它占用的空间大小要比GBK大,对于网站打开速度而言,也是有一定影响的。
GBK编码格式,它的功能少,仅限于中文字符,当然它所占用的空间大小会随着它的功能而减少,打开网页的速度比较快。

UTF-8转GBK

//UTF8格式转换为GBKvoid UTF8ToGBK(char *&szOut){    unsigned short *wszGBK;    char *szGBK;    int len = MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)szOut, -1, NULL, 0);    wszGBK = new unsigned short[len+1];    memset(wszGBK, 0, len * 2 + 2);    MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)szOut, -1, (LPWSTR)wszGBK, len);    len = WideCharToMultiByte(CP_ACP, 0, (LPWSTR)wszGBK, -1, NULL, 0, NULL, NULL);    szGBK = new char[len+1];    memset(szGBK, 0, len + 1);    WideCharToMultiByte(CP_ACP, 0, (LPWSTR)wszGBK, -1, szGBK, len, NULL, NULL);    memset(szOut,'\0',strlen(szGBK)+1);    memcpy(szOut,szGBK,strlen(szGBK));    delete []szGBK;    delete []wszGBK;}

GBK转UTF-8

//GBK格式转换为UTF格式void GBKToUTF8(char* &szOut){    char* strGBK = szOut;    int len=MultiByteToWideChar(CP_ACP, 0, (LPCSTR)strGBK, -1, NULL,0);    unsigned short * wszUtf8 = new unsigned short[len+1];    memset(wszUtf8, 0, len * 2 + 2);    MultiByteToWideChar(CP_ACP, 0, (LPCSTR)strGBK, -1, (LPWSTR)wszUtf8, len);    len = WideCharToMultiByte(CP_UTF8, 0, (LPWSTR)wszUtf8, -1, NULL, 0, NULL, NULL);    char *szUtf8=new char[len + 1];    memset(szUtf8, 0, len + 1);    WideCharToMultiByte (CP_UTF8, 0, (LPWSTR)wszUtf8, -1, szUtf8, len, NULL,NULL);    memset(szOut,'\0',strlen(szUtf8)+1);    memcpy(szOut,szUtf8,strlen(szUtf8));    delete[] szUtf8;    delete[] wszUtf8;}
0 0
原创粉丝点击