nodejs 采集
来源:互联网 发布:js元素添加样式类 编辑:程序博客网 时间:2024/05/21 17:06
var http = require("http");var fs = require("fs");var cheerio = require("cheerio");function downloadText(doc){ var $ = cheerio.load(doc); $(".content").each(function(idx,obj){ fs.writeFile('1.txt','',function(err){ if (err) throw err; fs.appendFile('1.txt',$(obj).text()); fs.appendFile('1.txt',"\r\n");console.log($(obj).text());console.log("\r"); }); }); $(".thumb").find("img").each(function(idx,obj){ var src = $(obj).attr("src"); if(/pic.xxxxx.com/.test(src)){ http.get(src, function(res) { res.setEncoding('binary'); var imageData =''; res.on('data',function(data){ imageData += data; }).on('end',function(){ var imageName = src.substr(src.length-12,12); fs.writeFile('images/'+imageName, imageData, 'binary', function (err) { if (err) throw err; console.log('图片已保存'); }); }); }).on('error', function(e) { console.log("Got error: " + e.message); }); } });}function start(){ http.get({hostname:'www.xxxxx.com', port:80, path:'/', headers:{"User-Agent":"Mozilla\/5.0 (Windows NT 6.1; WOW64) AppleWebKit\/537.36 (KHTML, like Gecko) Chrome\/38.0.2125.104 Safari\/537.36"}}, function (res) { var html = ""; res.on('data',function(data){ html += data; }).on('end',function(){ downloadText(html); }); })} start();
0 0
- nodejs 采集
- nodejs 采集新闻数据
- nodejs 采集新闻数据
- 利用nodejs+phantomjs+casperjs采集淘宝商品的价格
- 利用nodejs+phantomjs+casperjs采集淘宝商品的价格
- 利用nodejs+phantomjs+casperjs采集淘宝商品的价格
- 基于zigbee+arm+nodejs+html环境信息采集代码
- 采集
- 采集
- 采集
- 采集
- 采集
- 采集
- 采集
- 采集
- 采集
- 采集
- 采集
- svn提交的时候报版本错误
- linux mail命令详解
- MySQL数据库复制与恢复
- android 中 switch 时出现case expressions must be constant expressions
- 操作XML文件的jdom
- nodejs 采集
- Java循环语句
- 悟透JavaScript
- 导入javax.servlet.出错
- win7中443端口被system进程占用
- uses-permission权限列表
- 项目六:穷举法解决组合问题(5)委派任务
- 条件查询(criteria)
- 可转换成多种格式的PDF转换器