Python 边做边学 6 数据库构建

来源:互联网 发布:淘宝售后申请做工瑕疵 编辑:程序博客网 时间:2024/06/05 14:45

媳妇儿说:“XXX,你不爱我了~,你们公司有好吃的你都不问我要不要了~”
我:“~_~”

原文连接:http://blog.csdn.net/tomorrow13210073213/article/category/6931287

数据库构建

前文我们说过,数据库用mysql;具体的数据库下载、运行这里就不再详细说明,只介绍表结构。

基于前几篇文章对网页、源码、请求的分析,我就可以开始构建数据库了,下图是全部数据库表:
这里写图片描述
下面简单介绍一下这些表:

t_user_capture 待爬取用户

这里写图片描述
用于记录需要爬取数据的用户,由于后期处理数据库“datetime”格式字段遇到了些问题,这里,将时间全部设置成13位的“bigint”,存时间戳。其他表的时间也这么存。

另外,如前文所说,我们可以利用页面上用户的关注列表和被关注列表实现数据自增长,自增长数据就存在这张表里;即,获取某个用户的主页html之后,解析关注列表和被关注列表,将相关用户存到这张表里;

t_user_capture_log 爬取日志

这里写图片描述
用于记录用户信息爬取日志;

t_user 用户信息表

这里写图片描述
保存用户基本信息;

t_user_ccoin 用户C币数量

这里写图片描述

t_user_contact 用户联络信息

这里写图片描述

t_user_edu 用户教育经历

这里写图片描述

t_user_known_area 用户熟悉领域

这里写图片描述

t_user_medal 用户奖牌

这里写图片描述

t_user_relation 用户关系,关注与被关注

这里写图片描述
由于不能获取用户关注、粉丝的完整列表,这里只存储数量;

t_user_score 用户个模块分数

这里写图片描述

t_user_skill 用户专业技能

这里写图片描述

t_user_tag 用户标签

这里写图片描述

t_user_work 用户工作经历

这里写图片描述

以上就是全部数据表,表中的“UID”字段均指标“t_user”表中的“ID”;下篇我们将介绍项目整体设计。

以上内容仅供练习,学习使用;

原创粉丝点击