我的Python入门学习(一):网络刷博器爬虫

来源:互联网 发布:mac如何新建文件夹 编辑:程序博客网 时间:2024/04/27 10:12

最近两天开始学习Python,由于过去主要使用C,对Python的简洁易用感到很新奇,大大增加了学习的兴趣。

从今天开始记录Python的学习历程和笔记。一方面方便自己未来查阅,另一方面与大家共享学习。

简单浏览了一下Python的简单语法后,我上网找了一些资料。在查找的过程中,看到了一个由智普教育制作的Python学习视频,视频有一段名字叫做”网络刷博器爬虫“吸引了我的注意。

网络刷博器爬虫的基本原理:一些博客网站打开某博客,该博客访问量就加一,如果多次循环打开同一博客,该博客的访问量就会大量上升。

程序需要用到第三方函数库模块:httplib2

函数库的下载地址:https://code.google.com/p/httplib2/

使用前需要配置系统环境变量,在系统环境变量Path后添加python安装目录。进入httplib2模块的解压目录,运行settup.py安装即可

打开一个网页的代码为:

webbrowser.open_new_tab('网址')
有于打开一定数量的网页后,内存会增加,我们需要定时关掉浏览器,关掉浏览器的代码如下(关掉Chrome为例):

os.system('taskkill /F /IM chrome.exe')

同时要使用到while循环来循环操作,达到刷博客的目的。具体的代码仿照了智普教育学习视频,感谢智普教育,完整的代码如下:

import webbrowser as webimport timeimport osimport randomcount = random.randint(5,7)j=0while j<=count:    i=0    while i<=8 :        web.open_new_tab('网址')  #网址自己填入        i=i+1        time.sleep(0.8)    else:        os.system('taskkill /F /IM chrome.exe')        print j,'time webbrower closed'    j=j+1    


原创粉丝点击