c# 获取网页源码
来源:互联网 发布:淘宝营销短信关闭 编辑:程序博客网 时间:2024/05/17 01:01
C#获取指定网页HTML原代码可使用 WebClient WebRequest HttpWebRequest 三种方式来实现。
当然也可使用webBrowse!在此就不研究webBrowse如何获取了。
WebClient
WebRequest
HttpWebRequest
private string GetHttpWebRequest(stringurl) { Uri uri =new Uri(url); HttpWebRequest myReq = (HttpWebRequest)WebRequest.Create(uri); myReq.UserAgent ="User-Agent:Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; .NET CLR 1.0.3705"; myReq.Accept ="*/*"; myReq.KeepAlive =true; myReq.Headers.Add("Accept-Language","zh-cn,en-us;q=0.5"); HttpWebResponse result = (HttpWebResponse)myReq.GetResponse(); Stream receviceStream = result.GetResponseStream(); StreamReader readerOfStream =new StreamReader(receviceStream, System.Text.Encoding.GetEncoding("utf-8")); stringstrHTML = readerOfStream.ReadToEnd(); readerOfStream.Close(); receviceStream.Close(); result.Close(); returnstrHTML; }
注意“utf-8”应与指定网页的编码对应。
总结
可以看到HttpWebRequest 方式最复杂,但确提供了更多的选择性。
有的网站检测客户端的UserAgent!如163.com,你如果使用WebClient WebRequest方式获取时,将获取到的是错误提示页面内容。
而通过HttpWebRequest 就没问题。
源码下载:http://files.cnblogs.com/zjfree/GetHTML.rar
测试环境:WIN2003 + VS2005 + C# + winForm
- c# 获取网页源码
- C#获取网页源码
- C#获取网页源码
- c# 获取网页源码
- c# 获取网页源码
- c# 获取网页源码
- c# 获取网页源码
- C#获取网页源码
- C#获取网页源码
- c# 获取网页源码
- c# 获取网页源码
- C#获取指定网页源码
- C#多线程后台获取网页源码
- c#获取网页源码全解
- C#获取网页源码,自动判断网页字符集编码
- C#获取网页源码,自动判断网页字符集编码
- C#获取网页源码,自动判断网页字符集编码[转]
- C#用HttpWebRequest获取网页源码并自动检测编码
- jquery技巧总结
- javascript实现上下层高度拖动调节
- C51存储器类型与51单片机的物理区域
- js+JQuery实现返回顶部功能
- Eclipse CDT Plug-in Development
- c# 获取网页源码
- typedef用法总结
- asp.net验证控件自定义控件
- 统计在线已登录用户数量并获取客户端IP(涉及HttpSessionListener监听)
- horizon架构整理
- 【jquery】收藏本站——添加到浏览器的收藏夹
- Ext JS 4.2 Grid预览
- 黑马程序员-overload与override的区别
- 天气预报