极客学院爬虫re基本知识
来源:互联网 发布:python 退火算法 编辑:程序博客网 时间:2024/06/05 08:18
放这里比放电脑里查看方便
极客学院爬虫re基本知识代码
# -*- coding: utf-8 -*-"""Created on Sat May 7 07:58:13 2016@author: s"""import reold_url = 'http://www.jikexueyuan.com/course/android/?pageNum=2'total_page = 20f = open(r'...\text.txt', 'rb')#'...'为pathhtml = f.read().decode()#print(html)f.close()title = re.search('<title>(.*?)</title>', html).group(1)#print(title)url_links = re.findall('<a href="(.*?)">', html, re.S)for i in url_links: print(i)#ul_con = re.search('<ul>(.*?)</ul>', html, re.S).group(1)ul_con = re.findall('<ul>(.*?)</ul>', html, re.S)[0]#print(ul_con)con_char = re.findall('">(.*?)</a>', ul_con, re.S)for each_line in con_char: print(each_line)for i in range(2, total_page+1): new_url = re.sub('pageNum=\d', 'pageNum=%d'%i, old_url, re.S) print(new_url)
0 0
- 极客学院爬虫re基本知识
- Python爬虫实战:极客学院
- python爬虫下载极客学院视频
- 爬虫登陆极客学院,并下载视频
- python request版 极客学院爬虫V1
- python scrapy版 极客学院爬虫V2
- 极客学院单线程爬虫py3.x版本
- 爬虫基本知识
- Python简单网页爬虫——极客学院视频自动下载
- python 爬虫基本知识
- python 爬虫基本知识
- 爬虫基本知识梳理
- 极客学院推荐
- 爬虫---正则表达式:re库
- 【极客学院】-python学习笔记-4-单线程爬虫 (提交表单抓取信息,实战练习)
- 极客学院使用体会
- 极客学院 JAVA视频教程
- 极客学院视频分享
- Ubuntu 下android 开发遇到的各种问题
- static 关键字小解
- @Controller和@RestController的区别?
- 欢迎使用CSDN-markdown编辑器
- 很多人一辈子的道路实质上都取决于语文的学习
- 极客学院爬虫re基本知识
- JAVA httpClient 设置header
- 加油
- Nginx与Apache对比
- QT中PRO文件的写法
- 关于xxxx-validation.xml国际数据校验失败的问题
- 硬盘的存储原理和内部架构
- 移植DS1302到CC3200
- Swift-贝赛尔曲线画扇形、弧线、圆形、多边形——UIBezierPath实现App下载时的动画效果