网页源文件编码转换(UTF-8或BIG-5转换为GB)

来源:互联网 发布:淘宝视觉设计规范 编辑:程序博客网 时间:2024/05/01 13:11

sContent为存放网页源文件的string串,用到头文件CodeConverter.h(非库文件,他人编写),转换结束后的编码重新赋值给sContent

 

            //转换所需内存申请、赋初值
            size_t nFileSize = sContent.size();
            char *pcTemp = new char[nFileSize+1];
            memcpy(pcTemp, sContent.c_str(), nFileSize);
            pcTemp[nFileSize] = 0;

            size_t nNewCodeSize = 3*sizeof(char)*nFileSize;
            char *pcBuffer = new char[nNewCodeSize];
            memset(pcBuffer, 0, nNewCodeSize);

            //编码转换
            CCodeConverter *pclCodeIconv;
            if (sCharset=="utf-8" || sCharset=="UTF-8")
            {
                pclCodeIconv = new CCodeConverter("UTF-8", "GB2312");
                nNewCodeSize = pclCodeIconv->convert(pcTemp, nFileSize, pcBuffer, nNewCodeSize, 1);        //源码字符类型转换
                sContent = pcBuffer;
                delete pclCodeIconv;
                pclCodeIconv = NULL;
            }
            else if (sCharset=="big5" || sCharset=="BIG5")
            {
                pclCodeIconv = new CCodeConverter("BIG5", "GBK");
                nNewCodeSize = pclCodeIconv->convert(pcTemp, nFileSize, pcBuffer, nNewCodeSize, 1);
                sContent = pcBuffer;
                delete pclCodeIconv;
                pclCodeIconv = NULL;
            }
            else
            {
            }

            delete [] pcTemp;
            delete [] pcBuffer;

原创粉丝点击