selenium + python之元素定位

来源：互联网发布：决战武林神翼进阶数据编辑：程序博客网时间：2024/04/28 17:20

转载自：http://www.aichengxu.com/view/11949

selenium对web各元素的操作首先就要先定位元素，定位元素的方法主要有以下几种：

通过id定位元素：find_element_by_id("id_vaule")
通过name定位元素：find_element_by_name("name_vaule")
通过tag_name定位元素：find_element_by_tag_name("tag_name_vaule")
通过class_name定位元素：find_element_by_class_name("class_name")
通过css定位元素：find_element_by_css_selector();用css定位是比较灵活的
通过xpath定位元素：find_element_by_xpath("xpath")
通过link定位：find_element_by_link_text("text_vaule")或者find_element_by_partial_link_text()

以百度首页为例：下面是百度输入框的html代码，可以通过firebug或者谷歌的审查元素或得

<input type="text"name="wd" id="kw1" maxlength="100"style="width:474px;"

autocomplete="off">

1.通过id定位，则百度的输入框即可表示为：find_element_by_id("kw1")

2.通过name定位则可以表示为：find_element_by_name("wd")

3.通过tag_name定位：input其实就是tag_name（标签名），同样也可以表示成：

find_element_by_tag_name("input")

下面是“百度一下”按钮的html

<inputtype="submit" value="百度一下"
id="su1" class="btn" onmousedown=

"this.className='btnbtn_h'" onmouseout="this.className='btn'">

</span>

4.通过class_name定位，“百度一下”按钮则可以表示成find_element_by_class_name("btn_wr")

5.通过css定位，这个比较灵活，想要完全弄懂，花费的时间是

比较多的，个人觉得没有必要

百度输入框

<input

type="text" name="wd"id="kw1" maxlength="100"style="width:474px;"autocomplete="off">

如取id，百度输入框则可以表示为：find_element_by_css_selector("a[id=\"kw1\"]")
如取name，又可以表示为：find_element_by_css_selector("a[name=\"wd\"]")
<aonclick="queryTab(this);"mon="col=502&pn=0"title="web"href="http://www.baidu.com/">网页</a>
还可以用title，如百度的网页链接可以表示为find_element_by_css_selector("a[title=\"web\"]")

<aclass="RecycleBinxz"href="javascript:void(0);">

还也同样可以用class，上面的代码有可以用find_element_by_css_selector("a.RecycleBin")

6.通过XPath定位

首先我们要了解XPath是上面东西，XPath是一种在XML

文档中定位元素的语言。因为HTML可以看做XML的一种实现，

所以selenium用户可是使用这种强大语言在web应用中定

位元素，详情请阅读：

什么是XPath：http://www.w3.org/TR/xpath/
XPath基础教程：http://www.w3schools.com/xpath/default.asp

selenium中被误解的XPath：

http://magustest.com/blog/category/webdriver/

xpath:attributer（属性）

driver.find_element_by_xpath("//input[@id='kw1']")

表示input标签下id =kw1的元素

xpath:idRelative（id相关性）

driver.find_element_by_xpath("//div[@id='fm']/form/span/input")

表示在/form/span/input层级标签下有个div标签的id=fm的元素

driver.find_element_by_xpath("//tr[@id='check']/td[2]")

表示id为'check'的tr，定闪他里面的第2个td

xpath:position（位置）

driver.find_element_by_xpath("//input")

driver.find_element_by_xpath("//tr[7]/td[2]")

表示第7个tr里面的第2个td

xpath: href（水平参考）

driver.find_element_by_xpath("//a[contains(text(),'网页')]")

表示在a标签下有个文本（text）包含（contains）'网页' 的元素

xpath:link

driver.find_element_by_xpath("//a[@href='http://www.baidu.com/']")

表示有个叫a的标签，他有个链接href='http://www.baidu.com/的元素

7.通过link定位

有时候不是一个输入框也不是一个按钮，而是一个文字链接，我们可以通过link

#coding=utf-8

fromseleniumimportwebdriver

importtime

df = webdriver.Firefox() #选择firefox浏览器

df.get("http://www.baidu.com") #打开百度网页

time.sleep(2) #暂停2秒，不是毫秒

df.find_element_by_link_text("贴吧").click() #点击贴吧链接

time.sleep(2)

df.quit() #关闭浏览器

PartialLinkText定位

通过部分链接定位，这个有时候也会用到，我还没有想到很好的用处。拿上面的例子，我可以只用链接的一部分文字进行匹配：

browser.find_element_by_partial_link_text("贴").click()

通过find_element_by_partial_link_text()函数，我只用了“贴”字，脚本一样找到了"贴吧"的链接

0 0