python3爬取糗事百科实例
来源:互联网 发布:brooks跑鞋矩阵 编辑:程序博客网 时间:2024/06/09 20:14
完整代码:
# -*- coding: utf-8 -*-"""Spyder EditorThis is a temporary script file."""import requestsfrom bs4 import BeautifulSoupfrom time import sleepimport osimport shutildef get_qb(page_num): list_qs = [] url = 'http://www.qiushibaike.com/hot' for page in range(1, page_num + 1): cnt = 0 qbhot = '{0}/page/{1}'.format(url, str(page)) print("开始获取第{0}页糗事...".format(page)) r = requests.get(qbhot) soup = BeautifulSoup(r.text, "lxml") for tag in soup.find_all("div",attrs = {"class":'content'}): if tag.contents[1].string != None: content = tag.contents[1].string.strip() list_qs.append(content) cnt += 1 print('{0}条'.format(cnt)) if page % 4 is 0: sleep(1) return list_qsdef main(): page_num = 13 file_qb = "F:\\qiubai\\" if os.path.isfile(file_qb): os.remove(file_qb) if os.path.isdir(file_qb): shutil.rmtree(file_qb,True) os.mkdir(file_qb) file_qb = file_qb +"qiubai.txt" ls_qs = get_qb(page_num) with open(file_qb, 'w', encoding='utf-8') as f: f.write('\n'.join(ls_qs)) print("完成!")main()
结果:
阅读全文
0 0
- python3爬取糗事百科实例
- python3 爬取糗事百科
- python3糗事百科爬取
- 爬取糗事百科
- 爬取糗事百科
- 爬取糗事百科
- 爬取糗事百科
- 爬取糗事百科
- python3爬虫(2)--爬取糗事百科页面
- python3使用requests爬取糗事百科入mongodb库
- [python3]爬虫实战一之爬取糗事百科段子
- PHP爬取糗事百科首页糗事
- python网络爬虫实例(一):爬取糗事百科
- Python 爬虫 简单实例 爬取糗事百科段子
- [Python]爬取糗事百科
- 爬取糗事百科段子
- 简单爬取糗事百科
- 爬虫爬取糗事百科
- js实现浏览器右键菜单,屏蔽默认菜单
- window10系统中vmware虚拟机mac在安装vmwareTools后共享文件消失怎么查找
- 请恕在下直言,用Android Studio都是弱鸡?
- windows opencv新手读取视频或摄像头,一闪而过,只显示第一帧
- Python效率测试计时器()
- python3爬取糗事百科实例
- H5 音乐代码
- iOS_系统原生分享
- Qt 之 QSqlError Class
- android开发命令
- SpringMVC学习笔记(十一)
- 函数是如何调用的
- 单源最短路算法 Dijstra Bellman-Ford
- Linux内核设计与实现