【R语言爬虫】R语言提交get请求抓取城城理财数据
来源:互联网 发布:多边形区域填充算法 编辑:程序博客网 时间:2024/06/07 03:32
一、需求分析
抓取城城理财数据。
抓取url:
https://www.cclc.co/debts/lctz_all_all
二、实现源代码
rm(list=ls())library(XML)library(RCurl)url='https://www.cclc.co/debts/lctz_all_all'myheader <- c( "User-Agent"="Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.97 Safari/537.36", "Accept"="text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8", "Accept-Language"="gzip, deflate, sdch", "Connection"="keep-alive", "Accept-Charset"="GB2312,utf-8;q=0.7,*;q=0.7")d <- debugGatherer()web <- getURL(url, httpheader = myheader, debugfunction = d$update, verbose = T,ssl.verifyhost=FALSE,ssl.verifypeer=FALSE)url_list=""i=1:3url_list[i]=paste0('https://www.cclc.co/debts/lctz_all_all_',i+1)for(k in url_list){ web1 <-getURL(k, httpheader = myheader, debugfunction = d$update, verbose = T,ssl.verifyhost=FALSE,ssl.verifypeer=FALSE) web<-c(web,web1)}doc<-htmlParse(web,encoding = "UTF-8")project_title<-sapply(getNodeSet(doc,"//h2[@class='title']//a"),xmlValue)project_rate<-sapply(getNodeSet(doc,"//span[@class='main_top_num']"),xmlValue)project_day<-sapply(getNodeSet(doc,"//div[@class='datar fl']//p"),xmlValue)kk=length(project_day)project_money_start<-sapply(getNodeSet(doc,"//div[@class='progress-top']//span"),xmlValue)target_time<-Sys.Date()project<-data.frame(project_title=project_title[1:kk],project_rate=project_rate[1:kk],project_day=project_day[1:kk],target_time)project$platform<-c("城城理财")View(project)##################模糊匹配处理天数################a101<-grep("个月",project[,3])a102<-project[a101,]a102[,3]<-gsub("个月","",a102[,3])a102[,3]<-as.numeric(a102[,3])*30a201<-grep("天",project[,3])a202<-project[a201,]a202[,3]<-gsub("天","",a202[,3])a301<-rbind(a102,a202)a301[,3]<-as.numeric(a301[,3])View(a301)
阅读全文
1 0
- 【R语言爬虫】R语言提交get请求抓取城城理财数据
- 【R语言爬虫】R语言提交post请求抓取盈盈理财数据
- R语言爬虫系列6|动态数据抓取范例
- 网页数据爬虫-R语言
- R语言实现从豆瓣抓取数据
- 【R语言爬虫】网贷天眼数据平台表格数据抓取2
- R语言网页爬虫
- R语言爬虫尝试
- [R语言爬虫] 豆瓣网,10月图书抓取
- R语言:网页抓取之get the data
- 【R语言 数据分析】豆瓣电影R语言爬虫和数据分析
- R语言爬虫实践一
- R语言实现简单的网页数据抓取
- 学习利用R语言抓取上市公司的股票数据
- R语言:使用rvest包进行数据简单抓取
- R语言数据预处理
- R语言读入数据
- R语言读入数据
- 简单开发一个java 插件式demo
- 正确使用 Volatile 变量
- java小算法—求1+2+3+4+5...+n
- 报错Attempt to invoke virtual method 'boolean java.lang.String.equals(java.lang.Object)'
- java基础面试题
- 【R语言爬虫】R语言提交get请求抓取城城理财数据
- 将十六进制数据转换成有符号十进制数
- mybatis show sql
- Python环境配置和java共存
- Java 编程题目 第九题
- 用tomcat处理n个请求来说明,什么是进程,什么是线程
- splay bzoj 1588 营业额统计(HNOI 2002)
- 序列化帮助类
- Tensorflow中pad函数解析