XPath表达式

来源：互联网发布：淘宝达人论坛编辑：程序博客网时间：2024/04/30 21:26

对xml文档操作时，有些函数参数为xpath表达式，不是很了解，于是查了下资料大概表述如下：

XPath表达式

XML 文档对象模型 (DOM)

能够以编程方式读取、处理和修改 XML 文档。

XPath 表达式

XPath 表达式使用路径表示法（与 URL 中使用的路径表示法类似）寻址 XML 文档的各个部分。表达式计算为生成子元素集、布尔值、数字或字符串类型的对象。

URL与XPath 表达式比较

URL: 由文件系统中的文件夹和文件组成的层次结构。

每个级别具有唯一名称的文件。URL 总是标识单个文件。

相对特定文件夹（称为“当前文件夹”）进行计算。

XPath: 由 XML 文档中的元素和其他元素组成的层次结构。

每个级别的元素名可能不是唯一的。XPath 表达式标识所有匹配的元素集。

相对特定元素（称为表达式的“上下文”）进行计算。

基本 XPath 表达式 (判断是谁的集合!!)

1.当前上下文

以句点和正斜杠 (./) 作为前缀的表达式明确使用当前上下文作为上下文。例如，以下表达式引用当前上下文中的所有 <author> 元素：

./author

注意，此表达式等效于以下表达式：

author

2.文档根

以正斜杠 (/) 为前缀的表达式使用文档树的根作为上下文。例如，以下表达式引用此文档根的 <bookstore> 元素：

/bookstore

3.根元素

使用正斜杠后接星号 (title 不同。

bookstorelast-name

所有作为 <book> 元素的孙级的 <last–name> 元素。

*/*

当前上下文的所有孙级元素。

my:book

my 命名空间中的 <book> 元素。

my:*

my 命名空间中的所有元素。

属性

XPath 使用 @ 符号表示属性名。属性和子元素应公平对待，两种类型之间的功能应尽可能相当。

例如:

@style

当前元素上下文的 style 属性。

price/@exchange

当前上下文中 <price> 元素的 exchange 属性。

book/@style

所有 <book> 元素的 style 属性。

当前上下文节点的所有属性。

@my:*

my 命名空间中的所有属性。不包括 my 命名空间中的元素的未限定属性。

注意:

属性不能包含子元素，所以，如果对属性应用路径运算符，将出现语法错误。此外，不能对属性应用索引，因为根据定义，不为属性定义任何顺序。

price/@exchange/total

比较

运算符:

and 逻辑与

or 逻辑或

not() 非

= 相等

!= 不相等

< 小于

<= 小于或等于

> 大于

<= 大于或等于

| 集运算；返回两个节点集的联合

例如:

author[last-name = "Bob"]

至少包含一个值为 Bob 的 <last-name> 元素的所有 <author> 元素。

author[last-name[1] = "Bob"]

第一个 <last-name> 子元素的值为 Bob 的所有 <author> 元素。

author/degree[@from != "Harvard"]

包含 from 属性不等于 "Harvard" 的 <degree> 元素的所有 <author> 元素。

author[last-name = /editor/last-name]

包含与根元素下 <editor> 元素中的 <last-name> 元素相同的 <last-name> 元素的所有 <author> 元素。

author[. = "Matthew Bob"]

所有字符串值为 Matthew Bob 的 <author> 元素。

集运算

Union (|) 运算符

|（即 union）运算符返回两个操作数的联合，操作数必须是节点集。例如，//author | //publisher 返回的节点集结合了所有 //author 节点和所有 //publisher 节点。

例如:

first-name | last-name

包含当前上下文中的 <first-name> 和 <last-name> 元素的节点集。

(bookstore/book | bookstore/magazine)

包含 <bookstore> 元素中的 <book> 或 <magazine> 元素的节点集。

book | book/author

包含 <book> 元素中的所有 <book> 元素和所有 <author> 元素的节点集。

(book | magazine)/price

包含 <book> 或 <magazine> 元素的所有 <price> 元素的节点集。

筛选器和筛选模式

通过将筛选子句 [pattern] 添加到集合中，可以对任何集合应用约束和分支。筛选器类似于 SQL WHERE 子句。筛选器中包含的模式称为“筛选模式”。

例如:

book[excerpt]

至少包含一个 <excerpt> 元素的所有 <book> 元素。

book[excerpt]/title

至少包含一个 <excerpt> 元素的 <book> 元素内的所有 <title> 元素。

book[excerpt]/author[degree]

至少包含一个 <degree> 元素并且在至少包含一个 <excerpt> 元素的 <book> 元素内的所有 <author> 元素。

book[author/degree]

至少包含一个 <author> 元素并且该元素至少包含一个 <degree> 子元素的 <book> 所有元素。

book[excerpt][title]

至少包含一个 <excerpt> 元素以及至少包含一个 <title> 元素的 <book> 所有元素。

0 0