XPath学习

来源：互联网发布：高达00 知乎编辑：程序博客网时间：2024/06/06 01:53

XPath简介

XPath是一门在XML文档中查找信息的语言。XPath可用来在XML文档中通过元素和属性进行导航。XPath是W3C XSLT标准的主要元素，并且XQuery和XPointer都构建于XPath表达之上。因此，对XPath的理解是很多高级XML应用的基础。

XPath节点

<?xml version="1.0" encoding="ISO-8859-1"?><bookstore><book>  <title lang="en">Harry Potter</title>  <author>J K. Rowling</author>   <year>2005</year>  <price>29.99</price></book></bookstore>

节点(Node)
在XPath中，有七种类型的节点：元素、属性、文本、命名空间、处理指令、注释以及文档节点(或称为根节点)。
观察上面的XML文档，其中的节点例子：
```
     <bookstore>    (文档节点)     <author>J K. Rowling </author>   (元素节点)     lang="en"    (属性节点)
```
基本值(或称原子值，Atomic value)
基本值是无父或无子的节点。基本值的例子：
```
     J K. Rowling     "en"
```
项目(Item)
项目是基本值或者节点。

节点的关如下：

父(Parent)
每个元素以及属性都有一个父。在上面的XML文档中，book元素是title、author、year以及price元素的父。
子(Children)
元素节点可以有零个、一个或多个子。在上面的XML文档中，title、author、year以及price元素都是book元素的子。
同胞(Sibling)
拥有相同的父的节点。在上面的XML文档中，title、author、year以及price元素都是同胞。
先辈(Ancestor)
某节点的父、父的父、等等。在上面的XML文档中，title元素的先辈是book元素和bookstore元素。
后代(Descendant)
某个节点的子、子的子、等等。在上面的XML文档中，bookstore的后代是book、title、author、year以及price元素。

XPath语法

下面的例子中我们将使用这个XML文档:

<?xml version="1.0" encoding="ISO-8859-1"?><bookstore><book>  <title lang="eng">Harry Potter</title>  <price>29.99</price></book><book>  <title lang="eng">Learning XML</title>  <price>39.95</price></book></bookstore>

选取节点
XPath使用路径表达式在XML文档中选取节点。下面是最有用的路径表达式：

表达式描述namenode选取此节点的所有子节点/从根节点选取//从匹配选择的当前节点选择文档中的节点，而不考虑它们的位置.选取当前节点..选取当前节点的父节点@选取属性

对应XML文档的实例：

路径表达式结果bookstore选取bookstore元素的所有子节点/bookstore选取根元素bookstore。注释：假如路径起始于正斜杠(/)，则此路径始终代表到某元素的绝对路径bookstore/book选取属于bookstore的子元素的所有book元素//book选取所有book子元素，而不管它们在文档的位置bookstore//book选择属于bookstore元素的后代的所有book元素，而不管它们位于bookstore之下的什么位置//@lang选取名为lang的所有属性

谓语(Predicates)

谓语用来查找某个特定的节点或者包含某个指定的值的节点。谓语被嵌在方括号中。

示例：

(含谓语的)路径表达式结果/bookstore/book[1]选取属于bookstore子元素的第一个book元素/bookstore/book[last()]选取属于bookstore子元素的最后一个book元素/bookstore/book[last()-1]选取属于bookstore子元素的倒数第二个book元素/bookstore/book[position()<3]选取最前面的两个属于bookstore元素的子元素的book元素//title[@lang]选取所有拥有名为lang的属性的title元素//title[@lang=’eng’]选取所有title元素，且这些元素拥有值为eng的lang属性/bookstore/book[price>35.00]选取bookstore元素的所有book元素，且其中的price元素的值须大于35.00/bookstore/book[price>35.00]/title选取bookstore元素中的book元素的所有title元素，且其中的price元素的值须大于35.00

选取未知节点

XPath通配符可用来选取未知的XML元素。

通配符描述*匹配任何元素节点@*匹配任何属性节点node()匹配任何类型的节点

实例

路径表达式结果/bookstore/*选取bookstore元素的所有子节点//*选取文档中的所有元素//title[@*]选取所有带有属性的title元素

选取若干路径

通过在路径表达式中使用”|”运算符，您可以选取若干个路径。

示例

路径表达式结果//book/title | //book/price选取book元素的所有title和price元素//title | //price选取文档中的所有title和price元素/bookstore/book/title | //price选取bookstore元素的book元素的所有title元素，以及文档中所有的price元素

0 0