parser解析中文问题,xml
来源:互联网 发布:如何在C语言中用开根 编辑:程序博客网 时间:2024/05/20 16:01
又是一个编码问题,看来编码问题,以及编码之间转换是编程中的一个大问题。就像做翻译一样,你要从不同格式编码进行“翻译”。
在解析XML文件时同样再次遇到了编码问题,iphone开发中的NSXMLParser 解析针对的是UTF-8编码,在处理英文XML网页时,没有遇到任何的问题。但当处理到中文XML时,当执行parser时遇到了问题,无法进行解析。进行一番调试之后,我们发现是由于编码方式引起的。
在英文XML网页中网页源码的开头是:
<!--?xml version="1.0" encoding="UTF-8"?-->
而中文XML网页源码开头是:
<!--?xml version="1.0" encoding="gb2312"?-->
如果我们用[[NSXMLParser alloc] initWithContentsOfURL:url]时,就会因为编码问题而无法正确解析。
那我们怎么来处理呢?想法是先用一个NSData去读取网页信息,然后使用gb2312编码将NSData数据初始化到一个NSString中,再将NSString中的"gb2312"字符串用"UTF-8"代替,再将替换过的NSString初始化赋值到一个新的NSData上,我们再使用[[NSXMLParser] initWithData:nsdata]来进行解析。
转换并解析的代码如下:
//urlString 是待解析的XML网页的url地址
//获取网页XML到NSData中
NSData *data = [NSData dataWithContentOfURL:[[NSURL alloc] initWithString: urlString]];
//以gb2312的编码方式将获取的NSData数据转换到string中
NSString *string = [[NSString alloc] initWithData:data encoding:0x80000632];
//替换"gb2312"为"UTF-8"
string = [string stringByReplaceingOccurrenceOfString:@"/"gb2312/"" withString:@"/"UTF-8/""];
//将转换编码并替换后的string以UTF8编码初始化到NSData中
NSData *newData = [string dataUsingEncoding:NSUTF8StringEncoding];
//初始化解析器
xmlParser = [[NSXMLParser alloc] initWithData:newData];
[xmlParser parse];
- parser解析中文问题,xml
- 解析xml xml parser
- IPHONE parser 解析xml文件
- XML -Parser 安装问题1
- 采用Stanford Parser进行中文语法解析
- 采用Stanford Parser进行中文语法解析
- 采用Stanford Parser进行中文语法解析
- xml 解析问题(Warning parsing XML: XML InputStream(1) URI was not reported to parser for entity)
- 用Dom4j解析XML及中文问题
- 用Dom4j解析XML及中文问题
- 用Dom4j解析XML及中文问题
- 用Dom4j解析XML及中文问题
- 用Dom4j解析XML及中文问题
- 用Dom4j解析XML及中文问题
- android sax 解析xml中文编码问题
- android解析xml中文乱码问题
- Java DOM解析Xml中文乱码问题
- Java DOM解析Xml中文乱码问题
- Visual Studio通过Property Manager建立的*.vsprops文件定义的宏,优先于环境变量
- [4_1_fence6] Finding Shortest Cycle
- Linux常用命令之tar打包器
- 回溯算法
- crontab坑
- parser解析中文问题,xml
- 收藏的资源
- rhel6通过命令关闭防火墙并清除规则
- 诺基亚CEO暗示可能开发Android手机
- [OpenGL ES 03]3D变换:模型,视图,投影与Viewport .
- poj3006
- NSDate的使用
- UI界面类项目 demo
- android基础---HelloWorld(2)