python语言解析xml文件的常用的有两种方式
来源:互联网 发布:bim与gis数据集成 编辑:程序博客网 时间:2024/06/14 20:58
python语言解析xml文件的常用的有两种方式:
- 通过MiniDom库解析xml文件
- 通过ElementTree库解析xml文件
MiniDom方式解析xml
xml文件以data.xml为例,具体操作如下:
data.xml:
<?xml version="1.0" encoding="utf-8"?><info> <intro>保存用户的信息</intro> <list id='001'> <head>auto_userone</head> <name>Jordy</name> <number>12345678</number> <age>20</age> <sex>男</sex> <hobby>上网</hobby> </list> <list id='002'> <head>auto_usertwo</head> <name>功夫</name> <number>34443678</number> <age>18</age> <sex>男</sex> <hobby>功夫</hobby> </list></info>
1. 得到DOM对象
DOM是Document Object Model的简称,它是以对象树来表示一个XML。
import xml.dom.minidom
#得到dom对象
dom = xml.dom.minidom.parse("data.xml")
2. 得到文档元素对象
#得到文档元素对象
root = dom.documentElement #这里得到的是根节点info
#打印根节点的 名字 节点的值 节点类型
print root.nodeName,root.nodeValue,root.nodeType
节点的属性:
每一个节点都有它的nodeName,nodeValue,nodeType属性。nodeName为节点名字。
nodeValue是节点的值,只对文本节点有效。nodeType是节点的类型,现在有以下几种:
‘ATTRIBUTE_NODE’‘CDATA_SECTION_NODE’‘COMMENT_NODE’‘DOCUMENT_FRAGMENT_NODE’‘DOCUMENT_NODE’‘DOCUMENT_TYPE_NODE’‘ELEMENT_NODE’‘ENTITY_NODE’‘ENTITY_REFERENCE_NODE’‘NOTATION_NODE’‘PROCESSING_INSTRUCTION_NODE’‘TEXT_NODE’
3.子元素、子节点的访问
对于已经知道元素名字的子元素,可以通过使用getElementsByTagName()方法访问,例:
root.getElementsByTagName("intro") #读取intro子元素
返回的结果是一个列表。
如果要得到某元素下的所有子节点,可以使用childNodes属性:
root.childNodes
getElementsByTagName()可以搜索当前元素的所有子元素,包括所有层次的子元素。childNodes只保存了当前元素的第一层子结点。
比如:我们想要得到intro元素下的值“保存用户的信息”,实现如下代码:
node = root.getElementsByTagName("intro")[0]
for node in node.childNodes:
if node.nodeType in ( node.TEXT_NODE, node.CDATA_SECTION_NODE):
print node.data
这种方式在获取元素的文本时,需要先判断才行,所以使用起来感觉不是太方便。
ElementTree库解析xml文件
ElementTree属于python标准库的一部分,ElementTree的parse()方法是这个库的主要入口,它使用文件名或流对象作为参数,parse()方法会立即解析完整个文档,它返回的对象是整个文档的对象,而不是根元素,如果要获取根元素,可以调用getroot()方法。
使用上述的data.xml文档,通过ElementTree库解析的代码:
import xml.etree.ElementTree as ET#读取xml文件def load_xml_file(fileName): root = ET.parse(fileName).getroot() #获取文件描述 intro = root.find('intro').text print intro #获取所有list节点 all_users = root.findall('list') #遍历list节点的子元素 for user in all_users: #得到head节点的文本 head = user.find('head').text #得到name节点的文本 name = user.find('name').text #得到sex节点的文本 sex = user.find('sex').text print head,name,sexif __name__ == '__main__': load_xml_file('data.xml')
通过这种方式解析xml文件比起使用minidom库解析xml文件的,操作要方便的多。
- python语言解析xml文件的常用的有两种方式
- python语言解析xml文件的常用的有两种方式
- Python解析xml常用的俩种方式
- Android中XML文件常用解析方式的比较分析
- xml文件的解析方式
- XML三种常用的解析方式
- 关于XML解析的常用方式
- python语言解析xml文件
- Python语言解析xml文件
- 四种解析xml文件的方式
- android解析xml文件的方式
- android解析xml文件的方式
- Android解析xml文件的方式
- android解析xml文件的方式
- xml文件解析的三种方式
- xml文件解析的三种方式
- android解析xml文件的方式
- 四种解析xml文件的方式
- 人生第一个MYSQL外键(Foreign Key)的使用--二者类型一定要相同
- 数据库文本中关于换行和回车等特殊字符的输出显示问题
- 经典算法面试题解答(三)----- 最短路径、最长路径
- FAT32文件系统实践
- pku 3145
- python语言解析xml文件的常用的有两种方式
- [Activeden] flash翻书效果整站源码
- SDWriter
- 搭建一个小型的asterisk电话系统 (三、添加cdr记录,扩展账单系统)
- hdu2149 Public Sale-------巴什博奕 每次加一个数
- 最全的c++ map的用法
- substring截取字符串!
- 我们这么努力,也不过是为了成为普通____人文 / 我是谁家那小谁的日记
- Grub Rescue修复方法