libxml2使用

来源:互联网 发布:nba数据统计2017 编辑:程序博客网 时间:2024/05/16 12:17

本文简单介绍libxml2库在linux环境下的使用。

关于libxml库的基本使用,在http://xmlsoft.org/网上有文档。该文档对于函数的使用说明并没有很详细的介绍,参考引用几乎没有,想要在C语言中使用该库,看示例是最好的办法。但是当自己需要完成一些复杂的操作时,直接从文档中找到具体实现方法,并正确编码,很也难做到。该库对于内存使用上并没有做过多的表述,从API文档中,并不能知道取得的资源应该如何释放。笔者经过使用该库实现hash表与xml文件之单的转换,取得了一些经验。本文将以源代码方法讲述使用libxml库读写基本的xml文件,关于解析标准xml文件,像DOM模型之类的,就只能仔细查看相关解析器方面的API文档了。本文中关于资源的使用是经过valgrind测试之后,才放心地植入现有系统中。使用libxml库,最好是经过内存泄漏工具做检测,不然很容易出问题的。

我分两部分来介绍我的hashtable与XML文件之间的转换,第一部分,读xml,第二部分,写xml。

一、使用libxml读XML文件

要读xml,需要使用reader,这里介绍两种方式,一种从文件读取,一种从内存读取。其它就是通过libxml库中提供的两个API来建立reader.请看代码:

1、从文件建立reader

2、从内存建立reader

从上述代码来看,建立一个reader是非常容易的。

3、从reader中读数据

建立了reader之后,我们就可以通过reader的辅助函数来实现xml数据的读取。在这里,我讲述的是如何读一个文本方式的XML,并没有使用XML的专有模型。这种方式最原始,也是最容易理解的。

要读一个reader中的数据,使用xmlTextReaderRead来读一个元素,XML中的每一个元素都会经过reader依次读取,我们可以根据需要来检查当前reader位置的元素类型,并取出数据为已所用,当然还要释放由reader分配的数据空间。下面来看一下读的例子:

xmlTextReaderRead需要一个参数,就是我们前面进行的一个文本读取器指针,该函数返回1表示成功读取,0表示到达文件尾。当成功读取时,可能使用xmlTextReaderName读取当前位置的元素数据,并可以通过xmlTextTextReaderNodeType来读取XML元素的类型。

reader支持如上类型,我们可以根据当前类型来读取数据,因为不现的类型,读取数据的方式不同,比如xmlTextReaderReadString只能读元素(XML_READER_TYPE_ELEMENT)的名称或者文件类型(XML_READER_TYPE_TEXT)的数据。注意一点就是reader是按顺序读取每一个元素,在写代码时,应该不要假定后面一定是什么元素或者特定类型,应该去检测,保证软件的稳定性。

使用xmlTextReaderReadString返回一个元素(xmlChar*类型)时,该区域是由库分配的内存区域,需要使用xmlFree来释放,不然就有内存泄漏。

4、读xml的reader的释放与清理

笔者使用如下方式释放reader

有一个xmlTextReaderClose函数,当使用该函数时,要注意顺序,一定要在xmlFreeTextReader之前,不然就会出现错误。 

二、使用libxml2写xml

写xml文件要比读要来得容易,因为不需要考虑其它可能的因素。

1、写xml文件

2、写xml到内存空间

2、写xml数据到writer

写xml数据到writer是使用xmlTextWriterXXXXX的函数,具体可参考libxml提供的帮助文档。

在这里我介绍几个常用的函数:

xmlTextWriterStartDocument  --- 写一个XML文档的头,可以指定文档的编码格式

xmlTextWriterEndDocument    --- 结束一个XML文档

以上两个函数应该成对出现,后续的函数同样也需要成对出现,因为这是XML的规范。

xmlTextWriterStartElement     ---- 写开始元素   ---》<开始元素>

xmlTextWriterEndElement       ---- 写结束元素   ---》</结束元素>

也可以使如下函数实现一次性写入

xmlTextWriterWriteElement    ---- 写元素,包含数据 <开始元素>数据</结束元素>

 

三、关于libxml2处理中文问题,我将在下一篇的博文中继续。

 

附hashxml的读数据处理的部分代码:

原创粉丝点击