Java+Selenium3方法篇18-获取当前页的源码
来源:互联网 发布:广州凯申物流 知乎 编辑:程序博客网 时间:2024/05/01 10:14
本篇介绍webdriver中获取当前页面的源码,driver.getPageSource()的功能就类似,你打开一个网页,然后右键,选择查看源码一样效果。这个获取网页的源码,在网络爬虫中百分百是需要用到的。先来了解下,我们通过获取百度新闻首页的源码,打印到eclipse,看看效果。
相关脚本代码如下:
package lessons;import java.util.concurrent.TimeUnit;import org.openqa.selenium.By;import org.openqa.selenium.WebDriver;import org.openqa.selenium.WebElement;import org.openqa.selenium.chrome.ChromeDriver;public class ElementOpration {public static void main(String[] args) throws Exception { System.setProperty("webdriver.chrome.driver", ".\\Tools\\chromedriver.exe"); WebDriver driver = new ChromeDriver(); driver.manage().window().maximize(); driver.manage().timeouts().implicitlyWait(5, TimeUnit.SECONDS); driver.get("https://www.baidu.com"); Thread.sleep(1000); WebElement news_link = driver.findElement(By.linkText("新闻")); news_link.click(); Thread.sleep(1000); // 打印当前页面的源码 System.out.println(driver.getPageSource()); } }获取当前页源码就介绍到这里,至于如何拿到源码,如何去查找我们需要的信息,这里就不介绍。因为需要一点前端知识,和正则匹配的内容。
阅读全文
0 0
- Java+Selenium3方法篇18-获取当前页的源码
- Java+Selenium3方法篇17-获取当前页面URL
- Java+Selenium3方法篇16-driver方法获取当前页title
- Java+Selenium3方法篇19-获取浏览器窗体的句柄
- Java+Selenium3方法篇48-如何获取日期和时间
- Java+Selenium3方法篇23-iframe切换的问题
- Java+Selenium3方法篇25-isDisplayed方法
- Java+Selenium3方法篇13-findElements举例
- Java+Selenium3方法篇39-Explicit wait
- Java+Selenium3方法篇41-FluentWait
- Java+Selenium3方法篇0-如何在Eclipse上查看Selenium源码
- 【Java】获取当前方法的方法名
- Java+Selenium3方法篇2-Timeout接口相关方法介绍
- Java+Selenium3方法篇3-window接口相关方法介绍
- Java+Selenium3方法篇30-Selenium中截图方法-TakeScreenshot
- java中获取当前路径的方法
- Java获取当前时间的年月日方法
- Java 获取当前时间的年月日方法
- 18. 4Sum
- 大数据统计租房市场现状(上海篇)
- shell编程——if语句 if -z -n -f -eq -ne -lt
- Caffe2 Tutorials Overview(一)
- NETGEAR WNDR3800 刷机支持ipv6 部署本地git服务器
- Java+Selenium3方法篇18-获取当前页的源码
- TCP建立/关闭连接时握手过程中的状态情况
- Object-c的bool值的比较说明
- 装饰器学习
- java经典排序算法
- Windows 10安装MySQL配置时无响应解决方法
- DHCP服务器回复数据包是单播还是广播的争议
- Selenium2+python自动化7-xpath定位
- 了解资本与公司年报、财报