selenium + python之元素定位

来源:互联网 发布:决战武林神翼进阶数据 编辑:程序博客网 时间:2024/04/28 17:20

转载自:http://www.aichengxu.com/view/11949

selenium对web各元素的操作首先就要先定位元素,定位元素的方法主要有以下几种:



  • 通过id定位元素:find_element_by_id("id_vaule")
  • 通过name定位元素:find_element_by_name("name_vaule")
  • 通过tag_name定位元素:find_element_by_tag_name("tag_name_vaule")
  • 通过class_name定位元素:find_element_by_class_name("class_name")
  • 通过css定位元素:find_element_by_css_selector();用css定位是比较灵活的
  • 通过xpath定位元素:find_element_by_xpath("xpath")
  • 通过link定位:find_element_by_link_text("text_vaule")或者find_element_by_partial_link_text()

以百度首页为例:下面是百度输入框的html代码,可以通过firebug或者谷歌的审查元素或得

<input type="text"name="wd" id="kw1" maxlength="100"style="width:474px;"

autocomplete="off">

1.通过id定位,则百度的输入框即可表示为:find_element_by_id("kw1")

2.通过name定位则可以表示为:find_element_by_name("wd")

3.通过tag_name定位:input其实就是tag_name(标签名),同样也可以表示成:

find_element_by_tag_name("input")

下面是“百度一下”按钮的html

<span class="btn_wr">

<inputtype="submit" value="百度一下" 
id="su1" class="btn" onmousedown=

"this.className='btnbtn_h'" onmouseout="this.className='btn'">

</span>

4.通过class_name定位,“百度一下”按钮则可以表示成find_element_by_class_name("btn_wr")

5.通过css定位,这个比较灵活,想要完全弄懂,花费的时间是

比较多的,个人觉得没有必要

百度输入框

<input

type="text" name="wd"id="kw1" maxlength="100"style="width:474px;"autocomplete="off">

  • 如取id,百度输入框则可以表示为:find_element_by_css_selector("a[id=\"kw1\"]")
  • 如取name,又可以表示为:find_element_by_css_selector("a[name=\"wd\"]")
  • <aonclick="queryTab(this);"mon="col=502&pn=0"title="web"href="http://www.baidu.com/">网页</a>
  • 还可以用title,如百度的网页链接可以表示为find_element_by_css_selector("a[title=\"web\"]")

<aclass="RecycleBinxz"href="javascript:void(0);">

  • 还也同样可以用class,上面的代码有可以用find_element_by_css_selector("a.RecycleBin")

6.通过XPath定位

首先我们要了解XPath是上面东西,XPath是一种在XML

文档中定位元素的语言。因为HTML可以看做XML的一种实现,

所以selenium用户可是使用这种强大语言在web应用中定

位元素,详情请阅读:

什么是XPath:http://www.w3.org/TR/xpath/
XPath基础教程:http://www.w3schools.com/xpath/default.asp

selenium中被误解的XPath:

http://magustest.com/blog/category/webdriver/

xpath:attributer(属性)

driver.find_element_by_xpath("//input[@id='kw1']")

表示input标签下id =kw1的元素

xpath:idRelative(id相关性)

driver.find_element_by_xpath("//div[@id='fm']/form/span/input")

表示在/form/span/input层级标签下有个div标签的id=fm的元素

driver.find_element_by_xpath("//tr[@id='check']/td[2]")

表示id为'check'的tr,定闪他里面的第2个td

xpath:position(位置)

driver.find_element_by_xpath("//input")

driver.find_element_by_xpath("//tr[7]/td[2]")

表示第7个tr里面的第2个td

xpath: href(水平参考)

driver.find_element_by_xpath("//a[contains(text(),'网页')]")

表示在a标签下有个文本(text)包含(contains)'网页' 的元素

xpath:link

driver.find_element_by_xpath("//a[@href='http://www.baidu.com/']")

表示有个叫a的标签,他有个链接href='http://www.baidu.com/的元素

7.通过link定位

有时候不是一个输入框也不是一个按钮,而是一个文字链接,我们可以通过link

#coding=utf-8

fromseleniumimportwebdriver

importtime

df = webdriver.Firefox() #选择firefox浏览器

df.get("http://www.baidu.com") #打开百度网页

time.sleep(2)  #暂停2秒,不是毫秒

df.find_element_by_link_text("贴 吧").click()  #点击贴吧链接

time.sleep(2)

df.quit()  #关闭浏览器

PartialLinkText定位

通过部分链接定位,这个有时候也会用到,我还没有想到很好的用处。拿上面的例子,我可以只用链接的一部分文字进行匹配:

browser.find_element_by_partial_link_text("贴").click()

通过find_element_by_partial_link_text()函数,我只用了“贴”字,脚本一样找到了"贴吧"的链接

0 0
原创粉丝点击