.Net解析html文档类库HtmlAgilityPack完整使用说明
来源:互联网 发布:京东和淘宝双11销售额 编辑:程序博客网 时间:2024/05/20 01:37
一个解析html的C#类库HtmlAgilityPack
HtmlAgilityPack是一个基于.Net的、第三方免费开源的微型类库,主要用于在服务器端解析html文档(在B/S结构的程序中客户端可以用Javascript、jquery解析html)。截止到本文发表时,HtmlAgilityPack的最新版本为 1.4.6。下载地址:http://htmlagilitypack.codeplex.com/。最新版本支持Linq to Objects ( LINQ to Xml ).
准备:
如果你有安装Nuget的话,可以直接查找安装即可。
下载后解压缩后有3个文件,这里只需要将其中的HtmlAgilityPack.dll(程序集)、HtmlAgilityPack.xml(文档,用于Visual Studio 2008中代码智能提示和帮助说明之用)引入解决方案中即可使用,无需安装任何东西,非常好用。
在C#类文件开头引入using HtmlAgilityPack;就可以使用该命名空间下的类型了。实际使用中,几乎都是以HtmlDocument类为主线的,这一点非常类似于微软.net framework中的XmlDocument类。XmlDocument类是操作的是xml文档,而HtmlDocument类操作的是html文档(其实也可以操作xml文档),它们的操作方式都是基于Dom,所不同的是后者取消了诸如GetElementsByTagName这样的方法,强化了GetElementById方法(在HtmlDocument中可以直接使用,而XmlDocument则不可以)。
HtmlAgilityPack中定位节点基本上都用Xpath表达式,Xpath表达式的参考文档可见:http://www.w3school.com.cn/xpath/xpath_syntax.asp。自行学习。
- .Net解析html文档类库HtmlAgilityPack完整使用说明
- .Net解析html文档使用类库HtmlAgilityPack
- .net HtmlAgilityPack解析返回的html字符串
- HTML解析利器HtmlAgilityPack
- HTML解析利器HtmlAgilityPack
- HTML解析利器HtmlAgilityPack
- htmlagilitypack解析Html
- HTML解析利器HtmlAgilityPack
- HTML解析利器HtmlAgilityPack
- HTML解析利器HtmlAgilityPack
- HTML解析利器HtmlAgilityPack
- HTML解析利器HtmlAgilityPack
- HTML解析利器HtmlAgilityPack
- HTML解析利器HtmlAgilityPack
- html解析器 HtmlAgilityPack
- HTML解析利器HtmlAgilityPack
- HtmlAgilityPack 解析HTML利器
- 使用HtmlAgilityPack解析html
- FasterRCNN训练自己数据记载
- 记录一个令人尴尬的问题
- FJUT 3097(hdu 3333) 区间种类数 线段树+离线
- 折半查找法——在有序整形数组中寻找
- Linux命令(25)——cp命令
- .Net解析html文档类库HtmlAgilityPack完整使用说明
- Oracle用户管理
- Android使用百度地图定位
- Http协议简介
- idea常用设置
- kettle solr plugin
- ImageLoader配置
- DNS原理及其解析过程【精彩剖析】
- 数组指针——指向数组首元素和指向数组的区别