Python web —— webbrowser + feedparser 网络爬虫刷博器

来源:互联网 发布:诺德软件 编辑:程序博客网 时间:2024/04/26 12:08

强大的 Python,强大的 Python web。

我们以 csdn 上的博客文章为例,

  • (1)使用 feedparser 根据 rss 地址,解析前 20 篇博客 url,添加到一个 list

  • (2)用 webbrowser 迭代打开 list 中的 blog url,

  • (3)因为网页资源十分地消耗内存,我们设置每打开 5 个 url,则调用 cmd 命令强制终止浏览器进程。

import webbrowser as webimport timeimport osimport feedparserd = feedparser.parse('http://blog.csdn.net/lanchunhui/rss/list')blog_urls = [entry.id for entry in d.entries]cnt = 0for url in blog_urls:    web.open_new_tab(url)    cnt += 1    time.sleep(3)    if not (cnt % 5):        os.system('taskkill -F -IM SogouExplorer.exe')

References

[1] 网络刷博器

0 0