取网页的源码~~~
来源:互联网 发布:泡利矩阵 编辑:程序博客网 时间:2024/05/20 03:42
方法一:
public System.Text.StringBuilder GetPageSource(string url)
{
HttpWebRequest request = (HttpWebRequest) WebRequest.Create(url);
request.Timeout = 15000;
request.KeepAlive = false;
StreamReader sr = null;
HttpWebResponse response = null;
Stream res = null;
System.Text.StringBuilder sb = new StringBuilder();
try
{
response = (HttpWebResponse) request.GetResponse();
res = response.GetResponseStream();
sr = new StreamReader(res,System.Text.Encoding.Default);
sb.Append(sr.ReadToEnd().ToLower());
}
catch
{ }
finally
{
if(sr!=null)
sr.Close();
if(res!=null)
res.Close();
}
return sb;
}
方法二:
public StringBuilder GetPageXML(string url,string startStr,string endStr)
{
System.Text.StringBuilder sb = new StringBuilder();
baseClass bc = new baseClass();
try
{
MSXML2.XMLHTTP60Class _xmlhttp = new MSXML2.XMLHTTP60Class();
_xmlhttp.open("GET",url,false,null,null);
_xmlhttp.setRequestHeader("CONTENT-TYPE","text/xml;charset=gb2312");
_xmlhttp.setRequestHeader("USER-AGENT","China89bot/1.0+(+http://www.55125.cn/bots/bot.html)Sam/20070205");
_xmlhttp.send("");
if(_xmlhttp.status==200)
{
string str = System.Text.Encoding.GetEncoding("gb2312").GetString((byte[])_xmlhttp.responseBody);
sb.Append(cutString(str.ToLower(),startStr,endStr));
}
else
{
sb.Append("");
}
}
catch
{ sb.Append(""); }
return sb;
}
- 取网页的源码~~~
- 怎样爬取网页的源码
- js取网页源码
- VB: 取网页源码
- curl 取网页源码
- 指定URL爬取网页源码
- python3爬虫第一步-爬取网页源码
- 爬取动态的网页。
- 获取网页的源码
- 获取网页的源码
- Scala 拿取网页源码简单匹配Demo
- 有session的取网页的数据
- 取网页的内容,网页小偷类的核心
- 用Get方法取网页的数据
- 用Post方法取网页的数据
- 取网页Links的正表达式
- 读取Nutch爬取的网页内容
- PB取网页内容的方法
- 在Virtualbox下安装Fedora 12图形界面不显示问题
- 知易行难
- 2007-03-02 |提取HTML文本中的所有超级链接! 20100321
- 开博啦
- 我的c++.始
- 取网页的源码~~~
- 看软件自带的说明文件真的很重要!
- 基于marquee类带停顿横向图片滚动代码
- JFreeChar详细
- OGRE一句话技巧
- 呵呵,现在比较忙
- Android移植成功:linux-2.6.25.8+U盘挂载
- 澳洲草原上的羊群
- 在jsp页面的背景里怎么添加FLSA