欢迎使用CSDN-markdown编辑器

来源:互联网 发布:一键传淘宝的弊端 编辑:程序博客网 时间:2024/06/03 21:55

QQ群号码提取器及其应用

1.摘要

利用Python爬虫实现QQ群号码,及QQ群成员的信息的提取,然后利用Python,实现QQ数据的处理分析.并实现了向群成员发送邮件的预处理.
2.需求分析
(1)要获取一个自己加入的一个群的所有的群成员QQ号并向其发送一些通知类的邮件,但这些群成员可能不是你的好友.无法通过QQ邮件进行批量发送
(2)分析加入成员的Q龄,性别,群活跃度等信息.并以将数据可视化,并筛选符合一定条件的群成员,根据群的功能性向这些群成员推送相关内容(比如一个软件学习群可以找出活跃度最高的几个成员,并特殊推送消息;如果你把本学校的每一个新生群都加入了的话,可以利用这个软件查看本届新生的男女大致比例,数据的用法取决于你的数据量和具体需求).

2.运行环境

由于面对用户的不同可分为简单版和进阶版.
(1)简单版:面对普通用户,只需要简单配置一下电脑环境即可实现运行

python3.5的开发环境(Python加入到环境变量)

火狐浏览器52.0.2 (32 位),驱动geckodriver.exe(加入到火狐安装目录)并将其路径配置到环境变量中

Python 的selenium库

(2)进阶版:面对程序开发者,需反复查看调用群成员的用户,需要有一定的数据库操作知识,实现了部分数据的可视化

建议安装Anaconda集成开发环境,有利于Python爬虫的进阶学习(python有时安装其他框架的时候有好多坑)

安装mongodb数据库

火狐浏览器52.0.2 (32 位),驱动geckodriver.exe

Python 的selenium库

Echars,jquery

注意:因为时间的原因和一些技术原因,数据的可视化需要通过MongoDB_operate.py这个程序查询出来,然后手动录入到echardata.html中,需改的数据为40,41,42行的value值

原创粉丝点击