XML基础
来源:互联网 发布:iphone必备软件推荐 编辑:程序博客网 时间:2024/05/16 15:33
http://blog.csdn.net/ly61baby/article/details/6458380
1 编写说明
本文档主要介绍XML的基本知识及利用如何利用libxml来操作xml文件。
2 XML基础
XML是eXtensible Markup Language的缩写,它是一种可扩展性标识语言,能够让你自己创造标识,标识你所表示的内容。DOM全称是Document Object Model(文档对象模型),定义了一组与平台和语言无关的接口,以便程序和脚本能够动态访问和修改XML文档内容、结构及样式。XML创建了标识,而DOM的作用就是告诉程序如何操作和显示这些标识。
XML将数据组织成为一棵树,DOM通过解析XML文档,为XML文档在逻辑上建立一个树模型,树的节点是一个个的对象。这样通过操作这棵树和这些对象就可以完成对XML文档的操作,为处理文档的所有方面提供了一个完美的概念性框架。
XML 中共有12种节点类型,其中最常见的节点类型有5种:
元素:元素是 XML 的基本组成单元。,描述XML的基本信息。
属性:属性节点包含关于元素节点的信息,通常包含在元素里面,描述元素的属性。
文本:包含许多文本信息或者只是空白。
文档:文档节点是整个文档中所有其它节点的父节点。
注释:注释是对相关的信息进行描述、注释。
3 LibXml介绍
需求安装包:libxml2和libxm2-devel,其中libxml主要包括.so文件,libxml2-devel 包括开发文档和所有的.h文件。可用rpm –ql 命令查看,rpm –qd可查看文档信息。
3.1 数据类型--xmlChar
在libXml中用xmlCha 替代char,XML使用UTF-8编码的一字节字符串。如果你的数据使用其它编码,它必须被转换到UTF-8才能使用libxml的函数。
如同标准c中的char类型一样,xmlChar也有动态内存分配、字符串操作等相关函数。例如xmlMalloc是动态分配内存的函数;xmlFree是配套的释放内存函数;xmlStrcmp是字符串比较函数等等。基本上xmlChar字符串相关函数都在xmlstring.h中定义;而动态内存分配函数在xmlmemory.h中定义。
另外要注意,因为总是要在xmlChar*和char*之间进行类型转换,所以定义了一个宏BAD_CAST,其定义如下:xmlstring.h
#define BAD_CAST (xmlChar *)
原则上来说,unsigned char和char之间进行强制类型转换是没有问题的。
3.2 重要数据结构
XmlDoc: 代表DOM结构中的文档类型。包含由解析文档建立的树结构,xmlDocPtr是指向这个结构的指针。
xmlNode:代表DOM结构中的除文档类型类型外的其它节点类型。包含单一结点的结构,xmlNodePtr是指向这个结构的指针,它被用于遍历文档树。节点应该是xml中最重要的元素了,xmlNode代表了xml文档中的一个节点,实现为一个struct,内容很丰富:tree.h
typedef struct _xmlNode xmlNode;
typedef xmlNode *xmlNodePtr;
struct _xmlNode {
void *_private;
xmlElementType type;
const xmlChar *name;
struct _xmlNode *children;
struct _xmlNode *last;
struct _xmlNode *parent;
struct _xmlNode *next;
struct _xmlNode *prev;
struct _xmlDoc *doc;
xmlNs *ns;
xmlChar *content;
struct _xmlAttr *properties;
xmlNs *nsDef;
void *psvi;
unsigned short line;
unsigned short extra;
};
以看到,节点之间是以链表和树两种方式同时组织起来的,next和prev指针可以组成链表,而parent和children可以组织为树。所有节点都是文档XmlDoc节点的直接或间接子节点。同时还有以下重要元素:
l节点中的文字内容:content;
l 节点所属文档:doc;
l 节点名字:name;
l 节点的namespace:ns;
l 节点属性列表:properties;
Xml文档的操作其根本原理就是在节点之间移动、查询节点的各项信息,并进行增加、删除、修改的操作。xmlDocSetRootElement函数可以将一个节点设置为某个文档的根节点,这是将文档与节点连接起来的重要手段,当有了根结点以后,所有子节点就可以依次连接上根节点,从而组织成为一个xml树。
3.3 重要操作
3.3.1 创建XML文档
创建一个xml文档流程如下:
l 用xmlNewDoc函数创建一个文档指针doc;
l 用xmlNewNode函数创建一个节点指针root_node;
l 用xmlDocSetRootElement将root_node设置为doc的根结点;
l 给root_node添加一系列的子节点,并设置子节点的内容和属性;
l 用xmlSaveFile将xml文档存入文件;
l 用xmlFreeDoc函数关闭文档指针,并清除本文档中所有节点动态申请的内存
示例代码:
#include <stdio.h>
#include <libxml/parser.h>
#include <libxml/tree.h>
int main(int argc , char **argv)
{
xmlDocPtr pdoc = NULL;
xmlNodePtr proot_node = NULL ,pnode = NULL , pnode1 = NULL;
//创造一个新文档并设置要root节点
//在XML文档中有且只有一个root节点
pdoc = xmlNewDoc( BAD_CAST "1.0");
proot_node = xmlNewNode(NULL , BAD_CAST "plist");
xmlNewProp(proot_node , BAD_CAST "version" , BAD_CAST "1.0");
xmlDocSetRootElement(pdoc , proot_node);
pnode = xmlNewNode( NULL , BAD_CAST "dict" );
//创造root节点的子节点
xmlNewChild(pnode , NULL , BAD_CAST "key" , BAD_CAST "info");
pnode1 = xmlNewNode( NULL , BAD_CAST "dict" );
//保存文档
xmlSaveFormatFileEnc(argc > 1 ? argv[1] : "-", pdoc, "UTF-8", 1);
//释放文档指针
xmlFreeDoc(pdoc);
xmlCleanupParser();
xmlMemoryDump(); //debug memory for regression tests
return(0);
}
涉及相关函数:
xmlNewDoc,xmlNewNode,xmlDocSetRootElement,xmlSaveFile,xmlFreeDoc。
3.3.2 解释文档
解析一个xml文档,从中取出想要的信息,例如节点中包含的文字,或者某个节点的属性,其流程如下:
l 用xmlReadFile函数读出一个文档指针doc;
l 用xmlDocGetRootElement函数得到根节点curNode;
l curNode->xmlChildrenNode就是根节点的子节点集合;
l 轮询子节点集合,找到所需的节点,用xmlNodeGetContent取出其内容;
l 用xmlHasProp查找含有某个属性的节点;
l 取出该节点的属性集合,用xmlGetProp取出其属性值;
l 用xmlFreeDoc函数关闭文档指针,并清除本文档中所有节点动态申请的内存。
注意:节点列表的指针依然是xmlNodePtr,属性列表的指针也是xmlAttrPtr,并没有xmlNodeList或者xmlAttrList这样的类型。看作列表的时候使用它们的next和prev链表指针来进行轮询。只有在Xpath中有xmlNodeSet这种类型,其使用方法前面已经介绍了。
示例代码:
int main(int argc , char **argv)
{
xmlDocPtr pdoc = NULL;
xmlNodePtr proot=NULL , pcurnode = NULL;
char *psfilename;
if (argc < 1)
{
printf("error: Usage: %s filename/n" , argv[0]);
exit(1);
}
psfilename = argv[1];
pdoc = xmlReadFile(psfilename ,"UTF-8",XML_PARSE_RECOVER);
if(NULL == pdoc)
{
printf("error: open file %s" , psfilename);
exit(1);
}
pcurnode = xmlDocGetRootElement(pdoc);
if(NULL == pcurnode)
{
printf("error: empty document %s" , psfilename);
exit(1);
}
if(xmlStrcmp(pcurnode->name , BAD_CAST "plist") != 0)
{
printf("error document " );
exit(1);
}
if(xmlHasProp(pcurnode ,BAD_CAST "version"))
{
xmlChar *szAttr = xmlGetProp(pcurnode, BAD_CAST "version");
printf("get version : %s /n" , szAttr);
}
xmlFreeDoc(pdoc);
xmlCleanupParser();
return 0;
}
涉及函数:
xmlParseFile,xmlReadFile,xmlDocGetRootElement,xmlHasProp,xmlGetProp。其中xmlParseFile和xmlReadFile都具备打开XML文件的功能,xmlParseFile函数以默认方式读入一个UTF-8格式的文档,并返回文档指针。xmlReadFile函数读入一个带有某种编码的xml文档,并返回文档指针。
3.3.3 修改XML
有了上面的基础,修改xml文档的内容就很简单了。首先打开一个已经存在的xml文档,顺着根结点找到需要添加、删除、修改的地方,调用相应的xml函数对节点进行增、删、改操作。
示例代码:
#include <libxml/parser.h>
#include <iostream.h>
int main(int argc, char* argv[])
{
xmlDocPtr doc; //定义解析文档指针
xmlNodePtr curNode; //定义结点指针(你需要它为了在各个结点间移动)
char *szDocName;
if (argc <= 1)
{
printf("Usage: %s docname/n", argv[0]);
return(0);
}
szDocName = argv[1];
doc = xmlReadFile(szDocName,"GB2312",XML_PARSE_RECOVER); //解析文件
if (NULL == doc)
{
fprintf(stderr,"Document not parsed successfully. /n");
return -1;
}
curNode = xmlDocGetRootElement(doc);
if (NULL == curNode)
{
fprintf(stderr,"empty document/n");
xmlFreeDoc(doc);
return -1;
}
curNode = curNode->children;
while (NULL != curNode)
{
//删除newNode1
if (!xmlStrcmp(curNode->name, BAD_CAST "newNode1"))
{
xmlNodePtr tempNode;
tempNode = curNode->next;
xmlUnlinkNode(curNode);
xmlFreeNode(curNode);
curNode = tempNode;
continue;
}
//修改node2的属性值
if (!xmlStrcmp(curNode->name, BAD_CAST "node2"))
{
xmlSetProp(curNode,BAD_CAST "attribute", BAD_CAST "no");
}
//修改newNode2的内容
if (!xmlStrcmp(curNode->name, BAD_CAST "newNode2"))
{
xmlNodeSetContent(curNode, BAD_CAST "content changed");
}
//增加一个属性
if (!xmlStrcmp(curNode->name, BAD_CAST "newNode3"))
{
xmlNewProp(curNode, BAD_CAST "newAttr", BAD_CAST "YES");
}
//增加一个子节点
if (!xmlStrcmp(curNode->name, BAD_CAST "son"))
{
xmlNewTextChild(curNode, NULL, BAD_CAST "newGrandSon", BAD_CAST "new content");
}
curNode = curNode->next;
- XML基础
- XML基础
- XML基础
- XML基础
- xml基础
- XML基础
- xml 基础
- xml基础
- xml基础
- XML基础
- XML基础
- xml基础
- XML基础
- xml基础
- XML基础
- XML基础
- xml基础
- XML基础
- 《Javascript权威指南》学习笔记之七:面向对象编程(OOP)
- 多重背包模板
- Mac下暗黑服务器搭建(完全攻略,一个菜鸟的搭建之路)
- ubuntu限制本地网速
- cocos2dx-3.0 与 vs2013整合
- XML基础
- 数据库原理——主属性,属性,主码,候选码
- MAC下安装firefly新手教程
- 软件测试大背景
- C#实现VPN连接
- [Bzoj1208][HNOI2004]宠物收养所
- android菜瓜笔记之android lint problem
- 黑马程序员 函数重载小结
- UML-泛化、关联、聚合、组合、依赖