模拟网页访问的工具-htmlunit
来源:互联网 发布:北微传感器 淘宝 编辑:程序博客网 时间:2024/04/27 01:50
实际应用中,经常需要程序自动访问网页,执行一些操作。c#或MFC自带的browser需要创建窗口,不太方便。htmlunit作为一款开源的Java浏览器,能模拟各种网页访问,对js支持友好,文档齐全,使用起来非常方便。而曾经很流行的httpunit由于更新较慢,很多Js已经支持不了。
使用htmlunit主要有以下三步:
1)创建浏览器客户端:WebClient wc=nnew WebClient(BrowserVersion.INTERNET_EXPLORER_8);//支持最新的ie8,svn版本已经支持chrome了
2)访问网页:HtmlPage page=wc.getPage(url);//访问url指向的网页
3)访问网页中的元素,并操作。如page.getElementById().click()...
htmlunit对网页中的各种控件进行了封装,如select,input,button等等,能模拟用户几乎任意操作。
htmlunit对jquery支持良好,现在已经支持1.2.6版,新版虽然没说,但是测试起来似乎也没问题。
但是,有些js本身有问题,导致htmlunit解析出错也是有的。这种情况就需要开发者多动动脑,解决有bug的js问题了。。
- 模拟网页访问的工具-htmlunit
- 利用HtmlUnit 模拟浏览器抓取网页数据
- 模拟浏览器的神器 - HtmlUnit
- 使用HtmlUnit模拟浏览器执行JS来获取网页内容
- 爬虫的自我解剖(抓取网页HtmlUnit)
- 爬虫的自我解剖(抓取网页HtmlUnit)
- 爬虫的自我解剖(抓取网页HtmlUnit)
- 网页抓取HtmlUnit的使用简介
- 模拟http请求的网页调试工具
- CURL模拟访问网页
- htmlunit模拟注册
- htmlunit 模拟登陆 https
- htmlunit 模拟功能
- 并发访问模拟工具
- HtmlUnit实现模拟浏览器点击按钮的效果
- 利用htmlunit下载网页上的文件(未测试)
- htmlunit抓取js执行后的网页源码
- 学习htmlunit获取动态网页加载后的代码
- 富爸爸---穷爸爸
- VC中将word和txt相互转换
- 富爸爸---财富自由之路
- 3月16日,纪念日
- arm-linux-gcc 常用参数讲解 gcc编译器使用方法
- 模拟网页访问的工具-htmlunit
- OpenCV中函数cvEstimateObsProb的一个bug
- 在linux下安装usb设备
- 框架设计之感
- Linux axel下载工具使用
- java获取用户输入的字符串!...
- Ubuntu 10.04上安装NFS
- zoj 1242 Carbon Dating
- ubuntu10.04下qtcreator和opencv安装配置