爬虫简要示例 以简书四灵传奇为例
来源:互联网 发布:图解网络硬件 百度云 编辑:程序博客网 时间:2024/06/14 09:26
示例代码如下
使用requests模块请求 使用beautifulsoup模块解析 获取每个文章的链接 然后访问
import requestsfrom bs4 import BeautifulSoupdef jianshu(url): ''' :param url:需要请求的url列表 :return: 所有的单篇文章标题 ''' response=requests.get(url) response=response.text soup=BeautifulSoup(response,'html.parser') a_list=soup.find_all(name='a',attrs={'class':'title'}) #循环获取文章链接 link_list=[] for a in a_list: link='http://www.jianshu.com'+a.get('href') link_list.append(link) return link_list#简书为异步加载 此为作者的多页链接url_list=['http://www.jianshu.com/u/3f8ece25ff82?order_by=shared_at&page={}'.format(str(i)) for i in range(0,3)]for url in url_list: req=jianshu(url) for i in req: print('正在请求:... ',i) requests.get(i)
后续补充完善
阅读全文
1 0
- 爬虫简要示例 以简书四灵传奇为例
- git使用介绍-以刀塔传奇为例
- python实现爬虫--以CSDN为例
- 网络爬虫剖析,以Pyspider为例
- 基于HttpClient实现网络爬虫~以百度新闻为例
- 基于HttpClient实现网络爬虫~以百度新闻为例
- Scrapy网络爬虫框架实战[以腾讯新闻网为例]
- Java多层翻页网络爬虫实战(以搜房网为例)
- Wpe工作原理和教程-以传奇为列
- Wpe工作原理和教程-以传奇为列
- 零基础简单爬虫制作(以wjyt-china企业黄页爬虫为例)(上)
- 零基础简单爬虫制作(以wjyt-china企业黄页爬虫为例)(中)
- 零基础简单爬虫制作(以wjyt-china企业黄页爬虫为例)(下)
- 爬虫06 代码封装(以爬虫04为基础)
- [Python]网络爬虫(十):一个爬虫的诞生全过程(以山东大学绩点运算为例)
- [Python]网络爬虫(十):一个爬虫的诞生全过程(以山东大学绩点运算为例)
- [Python]网络爬虫(十):一个爬虫的诞生全过程(以山东大学绩点运算为例)
- [Python]网络爬虫(十):一个爬虫的诞生全过程(以山东大学绩点运算为例)
- not get much sleep that night after the
- TensorBoard-01-网络结构
- spring jar包详解
- 洛谷P3371 【模板】单源最短路径
- 基于mint-ui的移动应用开发案例一(简介)
- 爬虫简要示例 以简书四灵传奇为例
- Java中的强制类型转换
- ORA-28000:the account is locked 用户scott被锁
- python 多线程
- [Kafka]
- JAVA | 32
- 学习真的很难吗?
- 一文读懂Hinton最新Capsules论文
- 将字符串插入另一个字符串的指定位置