使用NSXMLParser解析XML数据

来源:互联网 发布:大数据挖掘 编辑:程序博客网 时间:2024/05/16 06:37
对xml进行解析的标准有两种:sax以及dom。
首先这两种标准并不是针对java的,他们在各种语言环境下都可以实现。dom是真正的国际标准。sax是事实的标准,它不由任何商业组织维 护,而是由一个非商业的组织在运作。就像iso7层模型和tcp/ip一样,虽然sax不是正式的标准,但是一点不影响其在xml解析领域的地位。
 
dom实现的原理是把整个xml文档一次性读出,放在一个树型结构里。在需要的时候,查找特定节点,然后对节点进行读或写。它的主要优势是实现简单,读写平衡;缺点是比较占内存,因为他要把整个xml文档都读入内存,文件越大,这种缺点就越明显。
 
sax的实现方法和dom不同。
SAX解析XML,是基于事件通知的模式,一边读取XML文档一边处理,不必等整个文档加载完之后才采取操作,当在读取解析过程中遇到需要处理的对象,会发出通知对其进行处理。由于该方法只在xml文档中查找特定条件的内容,并且只提取需要的内容。这样做占用内存小,灵活,正好满足我们的需求。
 

在iOS中,可以通过NSXMLParser实现sax方法解析xml文件。

对于NSXMLParser,常用的初始化方法有两种:通过XML的URL初始化和通过本地的XML文件初始化。

1.使用NSXMLParser解析XML网址数据

首先给出一个XML资源网址:http://rss.sina.com.cn/tech/index.shtml,也就是新浪新闻频道列表,可以用来练习解析XML数据。

使用NSXMLParser解析XML数据的关键是实现NSXMLParserDelegate中的方法:

#pragma mark -#pragma mark NSXMLParserDelegate/* 开始解析xml文件,在开始解析xml节点前,通过该方法可以做一些初始化工作 */- (void)parserDidStartDocument:(NSXMLParser *)parser{    NSLog(@"开始解析xml文件");}/* 当解析器对象遇到xml的开始标记时,调用这个方法开始解析该节点 */- (void)parser:(NSXMLParser *)parser didStartElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qNameattributes:(NSDictionary *)attributeDict{    NSLog(@"发现节点");}/* 当解析器找到开始标记和结束标记之间的字符时,调用这个方法解析当前节点的所有字符 */- (void)parser:(NSXMLParser *)parser foundCharacters:(NSString *)string{    NSLog(@"正在解析节点内容");}/* 当解析器对象遇到xml的结束标记时,调用这个方法完成解析该节点 */- (void)parser:(NSXMLParser *)parser didEndElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName{    NSLog(@"解析节点结束");}/* 解析xml出错的处理方法 */- (void)parser:(NSXMLParser *)parser parseErrorOccurred:(NSError *)parseError{    NSLog(@"解析xml出错:%@", parseError);}/* 解析xml文件结束 */- (void)parserDidEndDocument:(NSXMLParser *)parser{    NSLog(@"解析xml文件结束");}

在这里我选择了view-source:http://rss.sina.com.cn/news/allnews/tech.xml进行解析。

其中一项内容是:

<item><title><![CDATA[苹果设计主管艾维:设计最重要的是全心投入]]></title><link>http://go.rss.sina.com.cn/redirect.php?url=http://tech.sina.com.cn/it/2013-10-11/14588806471.shtml</link><author>SINA.com</author><guid>http://go.rss.sina.com.cn/redirect.php?url=http://tech.sina.com.cn/it/2013-10-11/14588806471.shtml</guid><category><![CDATA[科技新闻]]></category><pubDate>Fri, 11 Oct 2013 06:58:40 GMT</pubDate><comments></comments><description><![CDATA[  新浪科技讯 北京时间10月11日下午消息,苹果首席设计师乔尼・艾维(Jony Ive)接受媒体采访时表示,设计产品的过程中最重要的是要真心重视这项工作,付出自己最大的努力。而且要加强与各种材料的亲身接触,不能过度依赖电脑建模。  “在对待人们不会立刻发现的事情时,我....]]></description></item>




在这里要解析的是新闻的标题title,摘要description,发布时间pubDate。

首先声明三个数组来存储这些新闻内容:

static NSString *xmlURLString = @"http://rss.sina.com.cn/news/allnews/tech.xml"; // 要解析的XML网址@interface ViewController () <NSXMLParserDelegate>@property (nonatomic, strong) NSMutableArray *newsTitles;      // 标题@property (nonatomic, strong) NSMutableArray *newsDescription; // 摘要@property (nonatomic, strong) NSMutableArray *newsPublicDates; // 发布时间@property (nonatomic, strong) NSMutableString *tempString;     // 用于临时保存解析的字符数据@property (nonatomic, strong) NSXMLParser *xmlParser; // XML解析器@end

看看程序的界面:


有一个spinner_view用来指示正在解析xml数据,parse按钮按下后开始解析xml数据,showxml_textView用于显示解析后的新闻内容。

在按下parse按钮后,对解析器进行初始化并启动解析:

- (IBAction)parseXML:(id)sender {    xmlParser = [[NSXMLParser alloc] initWithContentsOfURL:[NSURL URLWithString:xmlURLString]];     xmlParser.delegate = self;    [xmlParser parse];}
必须要设置解析器的委托为自己。

在parse方法调用后,将触发NSXMLParser中的方法,开始进行XML解析工作:

#pragma mark -#pragma mark NSXMLParserDelegate/* 开始解析xml文件,在开始解析xml节点前,通过该方法可以做一些初始化工作 */- (void)parserDidStartDocument:(NSXMLParser *)parser{    [spinner_view startAnimating];    newsTitles = nil;    newsDescription = nil;    newsPublicDates = nil;    tempString = nil;    showxml_textView.text = @"";    NSLog(@"开始解析xml文件");}/* 当解析器对象遇到xml的开始标记时,调用这个方法开始解析该节点 */- (void)parser:(NSXMLParser *)parser didStartElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName   attributes:(NSDictionary *)attributeDict{        NSLog(@"发现节点");    if([elementName isEqualToString:@"title"])    {        if(newsTitles == nil)            newsTitles = [[NSMutableArray alloc] init];    }    else if([elementName isEqualToString:@"description"])    {        if(newsDescription == nil)            newsDescription = [[NSMutableArray alloc] init];    }    else if([elementName isEqualToString:@"pubDate"])    {        if(newsPublicDates == nil)            newsPublicDates = [[NSMutableArray alloc] init];    }    else {            }}/* 当解析器找到开始标记和结束标记之间的字符时,调用这个方法解析当前节点的所有字符 */- (void)parser:(NSXMLParser *)parser foundCharacters:(NSString *)string{    NSLog(@"正在解析节点内容");    if(self.tempString == nil)        self.tempString = [[NSMutableString alloc] init];    [self.tempString appendString:string];}/* 当解析器对象遇到xml的结束标记时,调用这个方法完成解析该节点 */- (void)parser:(NSXMLParser *)parser didEndElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName{    NSLog(@"解析节点结束");    if([elementName isEqualToString:@"title"])    {        [newsTitles addObject:self.tempString];    }    else if([elementName isEqualToString:@"description"])    {        [newsDescription addObject:self.tempString];    }    else if([elementName isEqualToString:@"pubDate"])    {        [newsPublicDates addObject:self.tempString];    }    else {            }    self.tempString = nil;}/* 解析xml出错的处理方法 */- (void)parser:(NSXMLParser *)parser parseErrorOccurred:(NSError *)parseError {    NSLog(@"解析xml出错:%@", parseError);}/* 解析xml文件结束 */- (void)parserDidEndDocument:(NSXMLParser *)parser{    if (!tempString) {        tempString = [[NSMutableString alloc] init];    }    for (int i = 2; i < 10; i++) {        [tempString appendString:newsTitles[i + 1]];        [tempString appendString:newsDescription[i]];        [tempString appendString:newsPublicDates[i]];        [tempString appendString:@"\n------------------------------------------------"];    }        showxml_textView.text = tempString;    NSLog(@"解析xml文件结束");    [spinner_view stopAnimating];}


简单说一说该解析过程:

(1)在parse方法调用后,受委托的类首先调用委托中的

/* 开始解析xml文件,在开始解析xml节点前,通过该方法可以做一些初始化工作 */- (void)parserDidStartDocument:(NSXMLParser *)parser
方法进行一些初始化工作,比如清空保存新闻内容的数组,对界面内容操作等。

(2)在解析过程中,如果遇到xml开始标记,表明已经遇到了一个xml节点,此时将调用委托中的

/* 当解析器对象遇到xml的开始标记时,调用这个方法开始解析该节点 */- (void)parser:(NSXMLParser *)parser didStartElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName   attributes:(NSDictionary *)attributeDict
方法开始解析这个节点。

这个时候,应该对存储节点的数组进行初始化工作。
(3)在解析节点时,将调用委托中的

/* 当解析器找到开始标记和结束标记之间的字符时,调用这个方法解析当前节点的所有字符 */- (void)parser:(NSXMLParser *)parser foundCharacters:(NSString *)string
方法解析该节点中的所有字符。此时可以用一个tempString变量保存其中的字符内容。
(4)在遇到一个xml结束标记后,表明解析该xml节点结束,此时可以调用

/* 当解析器对象遇到xml的结束标记时,调用这个方法完成解析该节点 */- (void)parser:(NSXMLParser *)parser didEndElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName
完成解析后的工作,例如将解析得到的结果存入数组中。

(5)如果解析出错,将调用

/* 解析xml出错的处理方法 */- (void)parser:(NSXMLParser *)parser parseErrorOccurred:(NSError *)parseError {    NSLog(@"解析xml出错:%@", parseError);}
进行出错处理。

(6)如果解析没有出错,也就是在成功解析整个XML文件后,将调用

/* 解析xml文件成功 */- (void)parserDidEndDocument:(NSXMLParser *)parser
在该方法中可以使用xml解析后的完整数据。

运行结果:




2.使用NSXMLParser解析本地的XML文件

可以在Xcode中新建一个RTF文件,然后将XML中的文字内容粘贴到该文件中,例如:

<?xml version="1.0" encoding="UTF-8"?><Data>     <Movie>           <title>good lucky to you</title>           <box>111</box>           <summary>This is a story</summary>     </Movie>     <Movie>           <title>hello</title>           <box>99</box>           <summary>oh,yes</summary>    </Movie>           <Movie>          <title>Cold</title>          <box>100</box>          <summary>I love cold weather</summary>    </Movie></Data>

最后将rtf后缀改为xml就可以了。


如果修改xml文件中的内容,比如去掉一个</summary>,那么在解析xml文件时将会出错,例如:

2013-10-11 16:46:27.777 XMLParserDemo[5636:a0b] 解析xml出错:Error Domain=NSXMLParserErrorDomain Code=76 "The operation couldn’t be completed. (NSXMLParserErrorDomain error 76.)" UserInfo=0x8c40f70 {NSXMLParserErrorLineNumber=20, NSXMLParserErrorColumn=13, NSXMLParserErrorMessage=Opening and ending tag mismatch: summary line 0 and Movie}
此时,程序将调用出错处理方法

/* 解析xml出错的处理方法 */- (void)parser:(NSXMLParser *)parser parseErrorOccurred:(NSError *)parseError {    NSLog(@"解析xml出错:%@", parseError);}
但最终不会调用

- (void)parserDidEndDocument:(NSXMLParser *)parser
也就是说,只有解析xml成功,才会有parserDidEndDocument:方法的调用。



和解析xml的url数据唯一不同的是解析器的初始化方法不同,这里的是:

- (IBAction)parseXML:(id)sender {    // xmlParser = [[NSXMLParser alloc] initWithContentsOfURL:[NSURL URLWithString:xmlURLString]];    NSString *path = [[NSBundle mainBundle] pathForResource:@"xml" ofType:@"xml"]; // 找到文件路径    NSFileHandle *file = [NSFileHandle fileHandleForReadingAtPath:path]; // 创建文件处理器    NSData *data = [file readDataToEndOfFile]; // 读取文件中的二进制数据    [file closeFile]; // 关闭文件    xmlParser = [[NSXMLParser alloc] initWithData:data]; // 通过文件中的二进制数据初始化xml解析器     xmlParser.delegate = self; // 设置委托    [xmlParser parse]; // 开始转换}

对于解析url的xml数据的解析器初始化方法为:

xmlParser = [[NSXMLParser alloc] initWithContentsOfURL:[NSURL URLWithString:xmlURLString]];

解析本地xml文件的解析器的初始化方法为:

NSFileHandle *file = [NSFileHandlefileHandleForReadingAtPath:path];//创建文件处理器

NSData *data = [filereadDataToEndOfFile];//读取文件中的二进制数据

xmlParser = [[NSXMLParseralloc]initWithData:data];//通过文件中的二进制数据初始化xml解析器


其解析过程是一样的,只是修改一下各个节点的节点名就可以了。

很简单,代码就不贴了。







原创粉丝点击