XPath学习

来源:互联网 发布:高达00 知乎 编辑:程序博客网 时间:2024/06/06 01:53

XPath简介

  XPath是一门在XML文档中查找信息的语言。XPath可用来在XML文档中通过元素和属性进行导航。XPath是W3C XSLT标准的主要元素,并且XQuery和XPointer都构建于XPath表达之上。因此,对XPath的理解是很多高级XML应用的基础。


XPath节点

<?xml version="1.0" encoding="ISO-8859-1"?><bookstore><book>  <title lang="en">Harry Potter</title>  <author>J K. Rowling</author>   <year>2005</year>  <price>29.99</price></book></bookstore>
  • 节点(Node)

      在XPath中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档节点(或称为根节点)。

      观察上面的XML文档,其中的节点例子:

         <bookstore>    (文档节点)     <author>J K. Rowling </author>   (元素节点)     lang="en"    (属性节点)
  • 基本值(或称原子值,Atomic value)

      基本值是无父或无子的节点。基本值的例子:

         J K. Rowling     "en"
  • 项目(Item)

      项目是基本值或者节点。

  节点的关如下:

  • 父(Parent)

      每个元素以及属性都有一个父。在上面的XML文档中,book元素是title、author、year以及price元素的父。

  • 子(Children)

      元素节点可以有零个、一个或多个子。在上面的XML文档中,title、author、year以及price元素都是book元素的子。

  • 同胞(Sibling)

      拥有相同的父的节点。在上面的XML文档中,title、author、year以及price元素都是同胞。

  • 先辈(Ancestor)

      某节点的父、父的父、等等。在上面的XML文档中,title元素的先辈是book元素和bookstore元素。

  • 后代(Descendant)

      某个节点的子、子的子、等等。在上面的XML文档中,bookstore的后代是book、title、author、year以及price元素。


XPath语法

  下面的例子中我们将使用这个XML文档:

<?xml version="1.0" encoding="ISO-8859-1"?><bookstore><book>  <title lang="eng">Harry Potter</title>  <price>29.99</price></book><book>  <title lang="eng">Learning XML</title>  <price>39.95</price></book></bookstore>
  • 选取节点
      XPath使用路径表达式在XML文档中选取节点。下面是最有用的路径表达式:
表达式描述namenode选取此节点的所有子节点/从根节点选取//从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置.选取当前节点..选取当前节点的父节点@选取属性


  对应XML文档的实例:

路径表达式结果bookstore选取bookstore元素的所有子节点/bookstore选取根元素bookstore。 注释:假如路径起始于正斜杠(/),则此路径始终代表到某元素的绝对路径bookstore/book选取属于bookstore的子元素的所有book元素//book选取所有book子元素,而不管它们在文档的位置bookstore//book选择属于bookstore元素的后代的所有book元素,而不管它们位于bookstore之下的什么位置//@lang选取名为lang的所有属性


  • 谓语(Predicates)

  谓语用来查找某个特定的节点或者包含某个指定的值的节点。谓语被嵌在方括号中。

  示例:

(含谓语的)路径表达式结果/bookstore/book[1]选取属于bookstore子元素的第一个book元素/bookstore/book[last()]选取属于bookstore子元素的最后一个book元素/bookstore/book[last()-1]选取属于bookstore子元素的倒数第二个book元素/bookstore/book[position()<3]选取最前面的两个属于bookstore元素的子元素的book元素//title[@lang]选取所有拥有名为lang的属性的title元素//title[@lang=’eng’]选取所有title元素,且这些元素拥有值为eng的lang属性/bookstore/book[price>35.00]选取bookstore元素的所有book元素,且其中的price元素的值须大于35.00/bookstore/book[price>35.00]/title选取bookstore元素中的book元素的所有title元素,且其中的price元素的值须大于35.00


  • 选取未知节点

  XPath通配符可用来选取未知的XML元素。

通配符描述*匹配任何元素节点@*匹配任何属性节点node()匹配任何类型的节点


  实例

路径表达式结果/bookstore/*选取bookstore元素的所有子节点//*选取文档中的所有元素//title[@*]选取所有带有属性的title元素


  • 选取若干路径

  通过在路径表达式中使用”|”运算符,您可以选取若干个路径。

  示例

路径表达式结果//book/title | //book/price选取book元素的所有title和price元素//title | //price选取文档中的所有title和price元素/bookstore/book/title | //price选取bookstore元素的book元素的所有title元素,以及文档中所有的price元素
0 0
原创粉丝点击