C#抓取他人网站内容贴到自己网站中
来源:互联网 发布:java aes加解密过长 编辑:程序博客网 时间:2024/05/17 03:56
研究了一下午,终于弄出来了,第一次写博客哈,不知道这儿有没有人看,就当写个笔记给自己,留着以后看吧,希望对他人也能有所帮助
初学c#,大神莫喷
var wc = new System.Net.WebClient(); byte[] htmlbyte = wc.DownloadData("http://www.xxx.org/");//此例对方网站编码为gb2312,此处若用DownloadString可能会出现乱码,好像.net中内存都是Unicode编码,所以只能用byte传输 String html = System.Text.Encoding.GetEncoding("gb2312").GetString(htmlbyte); //byte数组转换成字符串 var matches = System.Text.RegularExpressions.Regex.Matches(html, "<div class=\"classname\">(\\w|\\W)*?<\\/div>"); //获取指定div的集合 var MatchHtml = new List<string>(); foreach(var matchitem in matches) { var tempstring = matchitem.ToString().Replace("a href=\"", "a href=\"http://www.xxx.org");//将相对路径转化为绝对路径 MatchHtml.Add(tempstring); } ViewBag.Crawl = MatchHtml;//ViewBag传递到网页中
在网页中使用@Html.Raw()将选定的div表现出来
卡了两小时的乱码问题,一开始用的DownloadString,发现中文字符全变成了乱码,后来各种翻资料,看了一些大神的回复,最后终于改对了。
0 0
- C#抓取他人网站内容贴到自己网站中
- jsoup 实现在自己的网站中 抓取到 其他网站对自己感兴趣的信息
- Excel抓取网站内容
- 调用微博内容到自己网站
- 他人网站
- curl 实现抓取网站内容
- JAVA抓取网站网页内容
- JAVA抓取网站网页内容
- 抓取网站内容常见方法
- 如何抓取网站页面内容
- java抓取网站数据,存放到Excel中
- VBA模拟提交查询到他人网站,获得结果数据后写到一个Excel表中
- 打开浏览器 与 抓取网站内容
- nginx防止批量抓取网站内容
- 搜索引擎是如何抓取网站内容的
- 快速抓取某个网站内容方法
- 记录几个抓取网页内容的网站
- 远程抓取网站上的内容
- cocos2d-x的各种回调函数
- Android消息处理机制
- 求最大子数组的和以及输出最大子数组
- 几个招聘公司
- 简单方法判断主力成本
- C#抓取他人网站内容贴到自己网站中
- STL
- 理解矩阵一
- PHP学习 PDo查询数据库
- 《用MQL4编程》读书笔记(5)- 运算操作
- matlab 计算运行时间三种方式
- POJ 1068
- vector
- 欢迎您在新浪博客安家