c# 抓取 js动态生成的HTML的工具:NHtmlUnit
来源:互联网 发布:孙中山萝莉控 知乎 编辑:程序博客网 时间:2024/05/21 17:43
官方地址:NHtmlUnit
编译获取dll方法:
1.下载nuget.exe (nuget所在网站:http://www.nuget.org/)
2.打开DOS命令对话框,
进入nuget.exe文件所在目录(我的exe文件放在桌面)
3.运行命令安装NHtmlUnit,安装后会在当前目录创建两个文件夹,一个是安装所需环境IKVM,另一个就是需要的NHtmlUnit文件夹,里面的lib目录下面有生成的dll
运行命令:nuget install NHtmlUnit
3.使用方法可以去HtmlUnit的官方网站阅读文档,或在博客园搜索教程,与JAVA的HtmlUnit的用法是一样的,NHtmlUnit只是
在HtmlUnit上加了个壳使.net可以调用JAVA而已。
实例代码(引用dll:HtmlUnit,NHtmlUnit,为了偷懒,我把所有IKVM的dll都引用了):
class Program { static void Main(string[] args) { WebClient client = new WebClient(); client.Options.JavaScriptEnabled = false; client.Options.CssEnabled = true; client.Options.ThrowExceptionOnScriptError = false; client.Options.Timeout = 5000; HtmlPage page = client.GetHtmlPage("http://www.baidu.com/#wd=11&rsv_spt=1&issp=1&rsv_bp=0&ie=utf-8&tn=baiduhome_pg&rsv_sug3=2&rsv_sug2=0&inputT=26"); Thread.Sleep(3000); string xml = page.AsXml(); HtmlDocument doc = new HtmlDocument();//忽略此类,这个类是其他DLL提供的,与NHtmlUnit无关 doc.LoadHtml(xml); string nodeName = doc.GetElementbyId("container").Name; Console.WriteLine("\r\n\r\n\r\n\r\n" + nodeName + "\r\n\r\n\r\n\r\n" ); Console.Read(); } }
http://www.cnblogs.com/zcjiang/p/3579879.html
0 0
- c# 抓取 js动态生成的HTML的工具:NHtmlUnit
- python抓取javascript动态生成HTML内容的实践
- 使用selenium抓取JS动态生成的页面
- 使用phantomjs抓取JS动态生成的页面
- 使用phantomjs抓取JS动态生成的页面
- 查看js动态生成的HTML内容
- 权限控制--js动态生成的html
- java抓取动态生成的网页
- java抓取动态生成的网页
- JS创建HTML控件并动态生成页面的写法
- js动态生成html,获取点击的监控事件写法
- 利用phantomjs+selenium抓取fund.eastmoney.com/fund.html网站第二页js生成的页面
- C#动态生成html
- 利用phantomjs抓取js生成的页面
- Scrapy+splash抓取js生成的数据
- 如何抓取Js动态生成数据且以滚动页面方式分页的网页
- 如何抓取Js动态生成数据且以滚动页面方式分页的网页
- HTML动态生成的方法
- 【服务器配置】php move_uploaded_file文件移动失败
- MFC六大核心机制之三:动态创建
- myeclipse中通过java脚本或database connection driver连接sqlserver2008
- velocity模板技术生成word文档
- Leetcode 120 Triangle(图解)
- c# 抓取 js动态生成的HTML的工具:NHtmlUnit
- 智能电网学习1---基本术语与概念
- Selenium for C#的入门Dem
- 生成树协议(STP PVST CST RSTP MSTP)解析
- c++第二次作业2
- web HTML5的自定义属性data-xxx不能使用大写字母
- c# 网页测试自动化测试框架WatiN
- C#使用System.Data.SQLite操作SQLite
- 顶点数组对象