node.js 爬虫csdn个人博客主界面
来源:互联网 发布:网络课程超星尔雅登录 编辑:程序博客网 时间:2024/04/28 15:17
简单爬虫,抓取个人博客主页的文章信息。
var http = require('http');var cheerio = require('cheerio');var fs = require('fs');var url = 'http://blog.csdn.net/qq_35037977'; //爬虫的 csdn个人博客网址var articlesData = [];function articlesList(html) { var $ = cheerio.load(html); var str = ''; var articles = $('.article_item'); articles.each(function(index, ele) { var title = $(ele).find('.link_title').text().trim(); var link = $(ele).find('.link_title').find('a').attr('href'); var description = $(ele).find('.article_description').text(); var postime = $(ele).find('.link_postdate').text(); var viewtimes = $(ele).find('.link_view').text(); var comment = $(ele).find('.link_comments').text(); var article = { title: title, link: link, description: description, postime: postime, viewtimes: viewtimes, comment: comment } articlesData.push(article); }) articlesData.forEach(function(item, index, array) { var info = '标题: ' + item.title + '\n' + ' 链接:' + 'http://blog.csdn.net/' + item.link + '\n' + ' 发布时间' + item.postime + '\n' + ' 浏览次数:' + item.viewtimes + '\n' + ' 评论次数:' + item.comment + '\n' + ' 描述:' + item.description + '\n' + '\n' + '\n'; str += info; }) fs.writeFile('data.txt', str, 'utf8', function() { console.log('complete!'); })}http.get(url, function(respon) { var html = ''; respon.on('data', function(data) { html += data; }) respon.on('end', function() { articlesList(html); })}).on('error', function() { console.log('error,sorry!')})
爬虫得到的其中一个例子:
0 0
- node.js 爬虫csdn个人博客主界面
- Node.js+Hexo搭建个人博客系统
- Node.js批量刷CSDN博客访问量
- 爬虫 登录csdn并获取个人博客文章列表
- Vue.js + Node.js打造个人博客(新手向)
- 使用node.js搭建简易的个人博客(一)
- GitHub+node.js+hexo搭建个人博客教程
- node.js爬虫01
- node.js爬虫03
- node.js 小爬虫
- Node.JS 简单爬虫
- node js 小爬虫
- Node.js爬虫技术
- csdn博客爬虫更新
- Node爬虫 爬博客园
- CSDN个人博客开业
- 开通CSDN个人博客
- 个人博客csdn开园
- 线程安全及Python中的GIL
- 设计模式
- 用Canvas画一个七巧板
- clipdrawable的使用
- Python配置opencv并在命令行运行
- node.js 爬虫csdn个人博客主界面
- java DFA 敏感词过滤
- python 基础 —— collections.Counter()
- 传统企业IT架构如何能更好的支撑企业互联网业务的转型
- 通过分析 JDK 源代码研究 TreeMap 红黑树算法实现
- LeetCode 1.Two Sum map 初次使用Markdown*****
- 如何让产品,前端设计,开发,测试,部署,运维等各个环节更加规范化和流程化
- yum upgrade和yum update区别
- Android 7.0调用相机拍照,返回后显示拍照照片