如何直接提取HTML文档的title
来源:互联网 发布:code编程助手app 编辑:程序博客网 时间:2024/06/03 23:28
在C#中,一般我们在使用HTML的时候,都是直接使用WebBrower控件将去显示HTML,这很简单,唯一要注意的地方就是Navigate某个URL的时候,有可能我们并没有加载成功就开始使用了。因为navigate是异步的,一调用之后,不等待页面加载完毕就直接返回了.
比如:
此时,通过webBrowser.DocumentTitle取到的值是空字符串。
要想取得该加载的URL的title元素,最简单的方式就是处理WebBrowser的DocumentCompleted事件。代码如下。
现在有一个简单的需求,我们要取得某个已知的HTML文档里面的内容,如何不使用WebBrowser而直接通过读取HTML文件取得。
我们需要用到一个COM组件:Microsoft HTML Object Library. 通过使用该组件中的IHTMLDocument2就能够获取很多信息。
Tip: 右击工程->Add Reference->COM中选择该COM组建,在工程中就能看到MSHTML的引用,实际上,该COM组件最终使用的是X:/Windows/System32下的mshtml.dll。
下面的代码取得了某个.html文件的title元素。如果你想要获取其它信息,可以很简单的修改一下该函数即可。
下面的这种方式除了能够直接加载某个.html文档外,还能加载某个网站,如:http://www.google.com.hk/
Reference: http://capsulecorp.studio-web.net/tora9/cs/mshtml/HTMLDocument.html
- 如何直接提取HTML文档的title
- 如何提取html文档中的文本内容
- 如何提取PDF文档的页面
- HTML的title属性
- [分享]从HTML中提取TITLE和BODY标签内容的代码
- 如何获取WebView的url和title和html
- 如何给html头部的title添加icon
- 文章采集html文档的正文提取正则表达式
- 用javadoc提取此注释文档,并产生一个HTML文件,最后通过浏览器查看结果 直接Tools>Generate javadoc
- 如何快速的将word文档中的图片提取出来
- html元素的title属性
- HTML元素title里面如何换行
- 如何使用java的正则表达式提取html标签?
- 从HTML文档中提取链接
- HTML元素title里面和js里面几句话如何换行 格式代码是如何的?
- 提取网页的html
- 如何直接打开Visual Studio 2013 的帮助文档
- webview没有title,获取html的title方法。
- c语言静态变量和静态函数
- [推荐](穆穆推荐)如果你现在不成功,请看看你是不是选错了老板
- X264的x264_scan8变量
- “如果中国的每个程序员都能花点时间,写点什么..“有感
- 是否选择棱形区域
- 如何直接提取HTML文档的title
- 两个键盘一台电脑玩实况的方法
- 大中华区总裁孙振耀退休感言
- Tcp 断开连接
- java中interface中的方法为什么不能是static方法?
- 存储过程应用实例及应用语法说明
- 全国省市数据表(sql版)
- 如何使用ModelSim-Altera作電路模擬? (SOC) (Quartus II) (ModelSim)
- 撞球物理