R语言 天猫评论爬虫_new
来源:互联网 发布:淘宝在线使用 编辑:程序博客网 时间:2024/05/22 05:05
library(XML)
library(xml2)
library(rvest)
library(stringr)
url[i] <- paste0("https://rate.tmall.com/list_detail_rate.htm?itemId=544568867374&spuId=719363051&sellerId=661559176&order=3¤tPage=",i,"&append=0&content=1")
}
#利用jsonlite包抓取
download <- function(url){
web <- read_html(url,encoding = "GBK")
# 抓取内容
List <- web %>% html_nodes("p") %>% html_text %>%
str_replace('\"rateDetail\":',"") %>% fromJSON()
# 获取评论页数
List$paginator
# 获取内容
details <- List$rateList
# 合并为数据框
data <- data.frame(
User <- details$displayUserNick,
Sku <- details$auctionSku,
comment <- details$rateContent,
rateDate <- details$rateDate
)
}
# 进度条功能
library("tcltk")
library("tcltk2") # 这个包自定义进程形状更加好看
Sys.sleep(0.5)
for (i in 1:99){
{
info <- sprintf("程序已完成 %d%%", i)
setTkProgressBar(pb, i, sprintf("test (%s)", info), info)
}
if(i == 1){
data <- download(url[i])
}
else{
data1 <- download(url[i])
data <- rbind(data,data1)
}
library(xml2)
library(rvest)
library(stringr)
library(jsonlite)
#找出需要爬的网址(F12进入,network+F5刷新寻找评论)
url[i] <- paste0("https://rate.tmall.com/list_detail_rate.htm?itemId=544568867374&spuId=719363051&sellerId=661559176&order=3¤tPage=",i,"&append=0&content=1")
}
#利用jsonlite包抓取
download <- function(url){
web <- read_html(url,encoding = "GBK")
# 抓取内容
List <- web %>% html_nodes("p") %>% html_text %>%
str_replace('\"rateDetail\":',"") %>% fromJSON()
# 获取评论页数
List$paginator
# 获取内容
details <- List$rateList
# 合并为数据框
data <- data.frame(
User <- details$displayUserNick,
Sku <- details$auctionSku,
comment <- details$rateContent,
rateDate <- details$rateDate
)
}
# 进度条功能
library("tcltk")
library("tcltk2") # 这个包自定义进程形状更加好看
pb <- tkProgressBar("test progress bar",
"Some information in %",
0, 100, 0) # 最小,最大。起始位置Sys.sleep(0.5)
for (i in 1:99){
{
info <- sprintf("程序已完成 %d%%", i)
setTkProgressBar(pb, i, sprintf("test (%s)", info), info)
}
if(i == 1){
data <- download(url[i])
}
else{
data1 <- download(url[i])
data <- rbind(data,data1)
}
}
# 进度条关闭
close(pb)
#写入文档
write.csv(data0,"D://Rtest/excel.csv")阅读全文
0 0
- R语言 天猫评论爬虫_new
- R语言天猫爬虫NIKE产品
- R语言网页爬虫
- R语言爬虫尝试
- 网页数据爬虫-R语言
- R语言爬虫实践一
- R语言爬虫之——RCurl
- 一只R语言de爬虫
- R语言爬虫之——RCurl
- R语言爬虫之——RCurl
- 网页爬虫-R语言实现基本函数
- 网页爬虫-R语言实现基本函数
- R 语言爬虫 之 cnblog博文爬取
- 【R语言 爬虫】Rwebdriver 安装方法
- 基于R语言对用户评论进行情感分析
- 【R 语言爬虫】rvest 包实战链家爬虫
- 【R语言 爬虫】用R爬虫,爬取杭州安居客九堡租房信息
- python爬虫(6)——获取天猫商品评论信息
- centos7 配置静态ip
- 结束8080端口占用
- [水水文]Fused Text Segmentation Networks for Multi-oriented Scene Text Detection
- Linux 内核测试和调试(5)
- 关于Spring中的<task:annotation-driven/>配置
- R语言 天猫评论爬虫_new
- AI 崛起,科学家的天下,程序员的谢幕
- Fragment界面缓存问题
- 十位值得关注的Java顶级专家
- 341. Flatten Nested List Iterator
- cant connect to mysql server on localhost(10038)
- ajax动态刷新的元素里jquery绑定事件失效
- 对于机器学习,到底该选择哪种编程语言?
- java分布式系统部署学习(二)ansible构架