[ASP.NET]强大的网页处理类NSoup
来源:互联网 发布:淘宝网代理怎么做 编辑:程序博客网 时间:2024/05/24 07:18
获取网页的html代码
<span style="font-family: Arial, Helvetica, sans-serif;">NSoup.Nodes.Document doc = NSoup.NSoupClient.Connect("http://blog.csdn.net/dingxiaowie2013").Get();</span>
NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(HtmlString);
但是很遗憾NSoup默认的是UTF-8,处理中文会有乱码(对于编码是UTF-8自然会正常,但是有些是GB2312的就可能有乱码)
解决NSoup解析HTML乱码的办法
//下载网页源代码
WebClient webClient = new WebClient();
string htmlString = Encoding.GetEncoding("utf-8").GetString(webClient.DownloadData("http://www.baidu.com"));
NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(htmlString);
2.获得网页的流
//获得网页流
WebRequest webRequest = WebRequest.Create("http://blog.csdn.net/dingxiaowei2013");
NSoup.Nodes.Document doc1 = NSoup.NSoupClient.Parse(webRequest.GetResponse().GetResponseStream(), "utf-8");
效果图
==================== 迂者 丁小未 CSDN博客专栏=================
MyBlog:http://blog.csdn.net/dingxiaowei2013 MyQQ:1213250243
Unity QQ群:375151422,858550,6348968 cocos2dx QQ群:280818155
====================== 相互学习,共同进步 ===================
- [ASP.NET]强大的网页处理类NSoup
- ASP.NET网页的处理过程
- JSoup/NSoup对CSS类名称中含空格的处理
- ASP.NET强大的性能
- ASP.NET强大的性能
- ASP.NET强大的性能
- ASP.NET强大的SqlCacheDependency
- [转贴]ASP.NET强大的性能
- 强大的asp.net 绑定组件
- 强大的ASP.NET控件---验证控件
- C# NSoup.dll 抓取网页信息
- ASP.NET网页的组成
- asp.net 网页的跳转
- 体验VS2008的开发asp.net AJAX的强大功能
- IIS找不到ASP.Net选项卡,网页无法浏览的处理办法
- 一个很强大的ASP.NET画图控件(一)
- asp.net mvc 灰常强大的分页控件---MvcPager
- asp.net mvc强大的分页控件MvcPager
- 被PL/SQL developer坑了
- C++堆内存和栈内存详解
- SSL:javax.net.ssl.SSLException: Inbound closed before receiving peer's close_notify: possible trunca
- Matlab中批量读入图片——指定文件夹dir()
- 设计模式之代理模式
- [ASP.NET]强大的网页处理类NSoup
- EditText内容判断为空---赋值位置错误
- Eclipse ALT+/失效解决方案
- EL表达式怎么取出session里保存的值
- WINCE下使用SQLite数据库
- AR自动开票程序报错
- FFT的C语言算法实现
- WeEngine源码分析(1)
- linux下tomcat加入服务,及设置自启动