Python之读取XML文件

来源:互联网 发布:淘宝落地页是什么 编辑:程序博客网 时间:2024/05/22 00:48

XML文件概述

什么是XML文件?

xml即可扩展标记语言,它可以用来标记数据,定义数据类型,是一种允许用户对自己标记语言进行定义的源语言。

从结构上,很像HTML超文本标记语言。但他们被设计的目的是不同的,具体如下:

  • XML被设计用来传输和存储数据
  • HTML被设计用来显示数据

XML的特征

  • 它是由标签对组成,例如<aa></aa>
  • 标签的名称可以自定义
  • 标签可以有属性:<aa id='123'></aa>
  • 标签对可以嵌入数据:<aa>abc</aa>
  • 标签对可以嵌入子标签对,具有层级关系:<aa> <bb></bb> </aa>

XML文件结构

  • XML文档形成了一种树结构,它从“根部”开始,然后扩展到“枝叶”
  • 第一行是XML的声明,它定义XML的版本(1.0)和所使用的编码
  • <note>是根元素,也成为根节点
  • <to><from><heading><body>是子元素(子节点)
  • XML文档必须包含根元素。该元素是所有其他元素的父元素

XML节点

xml文件节点一般包含3类:
  1. 元素节点
  2. 文本节点
  3. 属性节点
每个节点都拥有包含着关于节点某些信息的属性。这些属性是:
  • nodeName(节点名称)
  • nodeValue(节点值)
  • nodeType(节点类型)

如果节点是元素节点,则nodeType属性将返回1
如果节点是属性节点,则nodeType属性将返回2

DOM文档对象模型

文档对象模型(Document Object Model,简称DOM),DOM就是针对HTML和XML提供的一个API。为了能以编程的方法操作HTML或者XML的内容(如修改元素,添加元素,删除元素),我们把这个HTML或XML看做一个对象树(DOM树),如<div></div>这些标签都看做一个对象,每个对象都叫做一个节点(node)。

DOM的作用

其作用就是为了操作HTML或XML中的元素,比如我们要通过JS吧这个网页的标题改了,直接这样就可以了:
docuemnt.title='new title'


创建XML文件



读取XML元素节点



读取XML文本节点




读取XML属性节点



读取XML子节点




原创粉丝点击