一个单线程爬取英文维基百科正文与链接关系的Python爬虫

来源:互联网 发布:linux源码详解 编辑:程序博客网 时间:2024/05/21 11:22

一个单线程爬取英文维基百科正文与链接关系的Python爬虫

正文如题。

代码参数详见代码(点击下载),运行结果为两个TXT文件,分别记录正文以及网页关系,文件保存格式详见同代码目录文本文件(文本为爬取深度为1的结果)。

原创粉丝点击