超简单Nsoup版Csdn博客爬虫
来源:互联网 发布:库里总决赛数据 编辑:程序博客网 时间:2024/04/29 22:43
自己摸索,.NET程序员也有春天
using System;using System.Collections.Generic;using System.IO;using System.Linq;using System.Net;using System.Text;using Microsoft.SqlServer.Management.Common;using Microsoft.SqlServer.Management.Smo;using NSoup.Select;namespace NsoupDemo{ class Program { static void Main(string[] args) { WebClient webClient = new WebClient(); webClient.Headers.Add("Host", "blog.csdn.net"); webClient.Headers.Add("Referer", "http://blog.csdn.net/WuLex/article/list"); webClient.Headers.Add("User-Agent", "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36"); for (int i = 1; i < 3; i++) { String HtmlString = Encoding.GetEncoding("utf-8").GetString(webClient.DownloadData("http://blog.csdn.net/WuLex/article/list/"+i)); NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(HtmlString); Elements elements = doc.GetElementsByClass("list_item"); foreach (var ele in elements) { string title = ele.GetElementsByClass("link_title").Text; string descripe = ele.GetElementsByClass("article_description").Text; string views = ele.GetElementsByClass("link_view").Text; Write(@"D:\Info.txt","\r\n"+title+"\r\n"+descripe+"\r\n"+views+"\r\n"); } } Console.ReadLine(); } public static void Write(string path,string content) { FileStream fs = new FileStream(path, FileMode.Append); StreamWriter sw = new StreamWriter(fs); //开始写入 sw.Write(content); //清空缓冲区 sw.Flush(); //关闭流 sw.Close(); fs.Close(); } }}结果图:
0 0
- 超简单Nsoup版Csdn博客爬虫
- 超简单BeautifulSoup版Csdn博客(摘要视图)爬虫
- 简单CSDN爬虫,实现博客访问量记录
- python 爬虫 CSDN博客下载-改进版
- csdn博客爬虫更新
- python3爬虫超简单实例
- Python爬虫实例- CSDN博客爬虫
- 鄙人自制csdn博客爬虫
- Python爬虫抓取csdn博客
- 通过爬虫迁移CSDN博客
- Hello Python!用python写一个抓取CSDN博客文章的简单爬虫
- 简单爬虫,爬取CSDN博客阅读数量并存入数据库
- 超简单的 Web 爬虫程序
- python爬虫之csdn刷博客访问量
- JAVA爬虫挖取CSDN博客文章
- python爬虫代码-CSDN博客下载
- php刷csdn博客访问,爬虫测试
- JAVA爬虫挖取CSDN博客文章
- android AsyncQueryHandler的分析
- 53. Maximum Subarray
- 安卓-获取图片/视频的缩略图
- 图论复习笔记
- STM32系列第16篇--RTC实时时钟
- 超简单Nsoup版Csdn博客爬虫
- Hibernate高级配置
- TCP/IP(四)ICMP协议,ping和Traceroute
- SELinux Redhat url
- HTML 5 应用程序缓存
- Android的消息循环机制 Looper Handler类分析
- Android开源项目整理
- hdoj 1432 && poj 2606 Lining Up (多点共线)
- HDU1198Farm Irrigation(并查集)