爬取京东商品评论
来源:互联网 发布:51单片机有趣的小制作 编辑:程序博客网 时间:2024/05/17 08:50
大概又是个陈年旧代码放上来看看
代码github:https://github.com/imcy/doubanAnaly
包括爬豆瓣和爬京东以及主题分析
- txt文档是用来写入好评和差评的
- ’fetchJSON_comment98vv13933’ 这个可以在打开商品页面拉到评论地方后,Chrome浏览器右键检查network,点击更多评论然后会捕捉到
https://club.jd.com/comment/productPageComments.action
这样的一个url,如下图所示,然后就可以看见这个url中的参数,把FetchJSON_comment98vv…复制下来改一下,还有就是Id也改一下,就可以愉快地爬所有评论了
# -*- coding: utf-8 -*-import re,requests,jsonimport codecsfrom bs4 import BeautifulSoupfile1=codecs.open('scorePos.txt','a', encoding='utf-8')file2=codecs.open('scoreNeg.txt','a', encoding='utf-8')s=requests.session()url='https://club.jd.com/comment/productPageComments.action'data={ 'callback':'fetchJSON_comment98vv13933', 'productId':'5001209', 'score':0, 'sortType':5, 'page':0, 'pageSize':10, 'isShadowSku':0, 'fold':1}while True: t=s.get(url,params=data).text try: t=re.search(r'(?<=fetchJSON_comment98vv13933\().*(?=\);)',t).group(0) except Exception as e: break j=json.loads(t) commentSummary=j['comments'] for comment in commentSummary: c_content=comment['content'] # 评论 c_time=comment['referenceTime'] c_name=comment['nickname'] c_client=comment['userClientShow'] score=comment['score'] print(score) print('{} {} {}\n{}\n'.format(c_name,c_time,c_client,c_content)) if score>=4: file1.write(c_content+'\n') if score<=3: file2.write(c_content+'\n') data['page']+=1file1.close()file2.close()
阅读全文
0 0
- 爬取京东商品评论
- python2.7爬取京东商品评论
- scrapy框架爬取京东商城商品的评论
- 商品评论表表结构设计
- Scrapy学习笔记(4)分布式爬取京东商品详情,评论和评论总结
- 商品评论的Tag模式
- 用户商品评论自动分类
- 淘宝商品评论爬取
- python json 爬京东商品评论
- scrapy爬取京东商城某一类商品的信息和评论(一)
- scrapy爬取京东商城某一类商品的信息和评论(二)
- 让zen cart商品评论显示在商品详情页面
- OpenCart之商品评论(Reviews)教程
- 【开源】scrapy爬取亚马逊商品评论
- 商品评论中的实体情感分析
- jquery 商品评论 星星点击 事件
- 京东商品及评论 数据采集
- python 多线程爬取考拉商品评论
- 1040寻找单身狗
- java中的i++与++i的区别以及除法、模的用法(基础)
- 3D数学基础:图形与游戏开发(第7章矩阵)笔记
- ssh登录失败
- Vuforia识别类型介绍
- 爬取京东商品评论
- [NOIP模拟][贪心]打牌
- Dapper
- noteBook2.9-C#基础第九天字符串
- cf,A. Mashmokh and Lights
- 函数
- Shiro入门学习二
- 大数据-时下已经大火的技术
- [NOIP模拟][规律探究]弹球