Python — 爬取 算法与数据结构 flash
来源:互联网 发布:搭建yum仓库 编辑:程序博客网 时间:2024/06/05 16:35
最近几天 ,在看数据结构的知识,看到bfprt算法的内容,不太了解。
查看了别人写的博客:http://blog.csdn.net/hnzziafyz/article/details/51339968,提到有一个福州大学的教学视频, http://ds.fzu.edu.cn/fine/resources/FlashContent.asp?id=82,关于算法的讲解用视频的方式最能够让人理解了。
其实是flash文件,看了下效果还不错。看了下网页一共有107页,打算全部下载下来。
http://ds.fzu.edu.cn/fine/resources/FlashContent.asp?id=82
分两部分:http://ds.fzu.edu.cn/fine/resources/FlashContent.asp?id= 和 82 (82为网页数)
模板url为 model_url = 'http://ds.fzu.edu.cn/fine/resources/FlashContent.asp?id='
点击全屏欣赏,网页跳到 : http://ds.fzu.edu.cn/fine/resources/TFlash/线性时间选择算法.swf
所以只需要模板URL中正则匹配到.swf文件就可以下载flash了,表达式为:reg = r'value="TFlash/(.+?\.swf)">'
#coding=utf-8import urllibimport remodel_url = 'http://ds.fzu.edu.cn/fine/resources/FlashContent.asp?id='flash_url = 'http://ds.fzu.edu.cn/fine/resources/TFlash/'#src="http://ds.fzu.edu.cn/fine/resources/TFlash/disarrayinsert.swf"def getHtml(url): page = urllib.urlopen(url) html = page.read() return htmldef getflash(html): reg = r'value="TFlash/(.+?\.swf)">' flashre = re.compile(reg) flashname = re.findall(flashre,html) print flashname for x in flashname: flash = flash_url + x urllib.urlretrieve(flash,x) print flashfor i in range(1,108): real_url = model_url+str(107) print real_url htmls=getHtml(real_url) getflash(htmls) print('The %d page\'s flash are downloaded' % i)
0 0
- Python — 爬取 算法与数据结构 flash
- Python数据结构与算法
- PYTHON数据结构与算法
- python数据结构与算法
- Python 数据结构与算法——递归
- Python 数据结构与算法——deque
- Python 数据结构与算法 —— 链表
- Python 数据结构与算法 —— 哈弗曼树
- Python 数据结构与算法 —— Prim 算法与小顶堆
- 数据结构与算法 python实现
- python中的数据结构与算法
- 数据结构与算法(Python)
- python数据结构与算法 1 基本数据结构
- Python 数据结构与算法——选取算法(TopK)
- Python 数据结构与算法 —— Kruskal 算法
- python数据结构与算法1: BF算法
- Python 数据结构与算法——tree(树)
- Python 数据结构与算法——归并排序
- 多控制器管理(UINavigationController)
- pycharm开发spark导入pyspark包
- 四平方和
- Leetcode-标签为stack 155. Min Stack
- 第一次使用Android Studio时你应该知道的一切配置
- Python — 爬取 算法与数据结构 flash
- 使用Android Studio遇到的一些常见问题总结
- 机器学习路线图(附资料)
- Java链表基础(2)
- 先搞个测试
- 第二章
- 文章标题
- 二叉树的最大深度
- 二分的终止条件具体怎么搞?