Python: XML文件解析

来源:互联网 发布:清代后宫 知乎 编辑:程序博客网 时间:2024/05/16 02:52

Python: XML文件解析 - minidom

使用xml.dom.minidom解析XML的小笔记

1 读入XML文件

# 导入import xml.dom.minidom# 输入路径FILE_PATH = 'example.xml'# 打开xml文档dom = xml.dom.minidom.parse(FILE_PATH)# 得到文档的树根元素root = dom.documentElement # TYPE: <DOM Element>

2 查找标签

例如节点root的子节点包含n个标签为component的子节点,

# root下标签名的component的子节点的列表 TYPE:<node_list>component_list = root.getElementsByTagName('component')

假如我们知道要找的节点就是第0个,就是component_list[0],它的type是<DOM Element>

3 获取标签属性内容

某个component

<component user="user_0">

读取user标签的内容:

# TYPE:<str>component.getAttribute('user')

4 获取标签对之间的内容

另一个component节点:

<component>    <apple>contents between apples</apple></component>

这里我们读取apple标签对之间的内容,从component节点出发:

component.getElementsByTagName('apple')[0].firstChild.data

输出结果(字符串型):

contents between apples