豆瓣机器人 自动加入/退出小组、自动在小组发帖/删帖、自动回复 Python实现代码
来源:互联网 发布:淘宝店铺专营类目 编辑:程序博客网 时间:2024/05/17 07:02
用Python实现了一个在豆瓣上 自动加入/退出小组、自动在小组发帖/删帖、自动回复 的小工具。
代码请见github:https://github.com/echoTheLiar/DoubanAuto
主要实现原理阐述如下:
1. 要在豆瓣上自动完成针对小组的操作,首先需要模拟浏览器登录,此处利用cookie携带登录信息,如利用上述代码,请在Chrome浏览器中右键检查,将获得的Cookie信息复制到代码文件 config/doubanCookies.txt 下替换原有内容即可
2. 自动加入小组:发帖的前提是加入小组。我在示例代码中演示了如何加入活跃的小组,可以修改代码按自己意愿调用;此处活跃小组是之前爬取到的豆瓣上成员超过10000的小组id,如需下载,请见http://download.csdn.net/download/doleria/10143962 ,没有这个文件也不影响功能,注释掉相关代码行即可;
3. 自动发帖、回帖:手动在浏览器中进行发帖操作(前提:在已加入的小组里),然后利用抓包程序(如fiddler)查看这一过程中POST或GET的具体参数,此处不再赘述;需要注意的是,有个ck参数,会随着用户变化而变化,代码中通过抓取html网页,提取相关标签信息,获得该值(该值cookie中也有,也可以从cookie中取),具体见 util/doubanutil.py 中的相关方法
4. 验证码识别:验证码识别模块调用百度OCR接口,自测识别率不是很高,但基本能满足要求。如要使用该功能,需要申请百度开发者账号,不再赘述;在该模块中,首先爬取发帖界面的html源码,取出验证码的存储地址,下载至本地 image/目录下,由于验证码有可能重复,为避免重复存储验证码图片,将图片地址命名为图片文件的md5值。这样,每次下载图片后,计算文件的md5值,如果已存在,则不保存至本地。
欢迎批评指正,提出意见。
===============================================
代码请见github:https://github.com/echoTheLiar/DoubanAuto
===============================================
- 豆瓣机器人 自动加入/退出小组、自动在小组发帖/删帖、自动回复 Python实现代码
- Python人人小组自动发帖
- Python实现微信自动回复机器人
- python实现微信机器人自动回复
- Python实现微信自动回复(机器人版本)
- Python实现微信自动回复机器人(简单)
- 自动回复聊天机器人
- python之微信自动回复机器人
- 使用ServerSocket实现自动回复机器人
- Python实现BBS自动登录并发帖
- Python写一个微信自动回复的机器人
- python实现微信自动回复及接入聊天机器人等功能
- Python-快速实现微信公众号自动回复(聊天机器人)
- python itchat实现微信自动回复
- python中利用itchat实现自动回复
- python 论坛自动发帖功能
- 实现自动回复
- python 实现微信自动回复(自动聊天)
- [Spring]支持注解的Spring调度器
- Linux TCP相关
- 数据结构实验之图论九:最小生成树
- 33333333333
- Linux system CIFS
- 豆瓣机器人 自动加入/退出小组、自动在小组发帖/删帖、自动回复 Python实现代码
- 使用Gson将对象类转成Json对象时出现\u003d的问题
- 怎么一键获取数千万企信数据-企业名录数据采集
- Linux C/C++多线程pthread实例
- 排序算法
- F(x) HDU
- 数据结构实验之图论七:驴友计划
- 【Scikit-Learn 中文文档】使用 scikit-learn 介绍机器学习
- Redis 存储List对象