python+正则表达式获取ed2k url
来源:互联网 发布:白百合离婚 知乎 编辑:程序博客网 时间:2024/05/16 12:34
python+正则表达式获取ed2k url
分类:
版权声明:本文为博主原创文章,未经博主允许不得转载。
近来找到了一套 MIT的 introduction to algorithms 课程,无奈网速太慢,在线根本看不了,于是乎决定搜搜国内有没有网站提供该套课程的下载,找了半天结果在 verycd.com中找到一套,可惜的是verycd.com不提供下载链接,所以只能想另外的方法看有没有网友提供它的下载链接,在网络搜索过程中发现
http://www.blogjava.net/lusm/archive/2007/07/26/132556.html
里面有提供下载,但是它的复制链接地址点不开,经过仔细观察,它的每一条下载链接都是一个ed2k url, 我思考了一把,如果一个一个链接处理很是恼人,于是决定写一个脚本来替我提取ed2k url, 代码如下:
- #!/usr/bin/python3.2
- import urllib.request
- import re
- def get_all_picaddr(startaddr = ''):
- response = urllib.request.urlopen(startaddr)
- htmlbytes = response.read()
- htmlstr = htmlbytes.decode(encoding='utf-8')
- alladdrs=re.findall(r'ed2k://.*\|/\s',htmlstr);
- for addr in alladdrs:
- print(addr)
- if __name__ == "__main__":
- get_all_picaddr("http://www.blogjava.net/lusm/archive/2007/07/26/132556.html")
在写这个代码的时候还要感谢这篇文章,一目了然地介绍了python中正则表达式的用法:
http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html
正是因为参考了这篇文章,我才能够顺利地写了一个粗略的ed2k URL 的正则表达式:
- 'ed2k://.*\|/\s'
其实我对python不熟,只用过一两次,每次都是用它来处理一些简单的字符串分析问题,它用起来确实很方便,我相信同样的功能如果用C/C++来实现的话估计是以代码的N倍工作量吧^_^.
0 0
- python+正则表达式获取ed2k url
- python+正则表达式获取ed2k url
- 使用python和正则表达式获取url,及总结
- 正则表达式获取URL参数
- 正则表达式获取url参数
- 正则表达式获取url参数
- Python 正则表达式验证URL
- 正则表达式获取url中的参数。
- PHP 正则表达式获取图片URL
- 正则表达式:获取一个URL中的Host
- url获取参数的正则表达式
- PHP 正则表达式获取图片URL
- 正则表达式获取URL中的域名
- scala正则表达式获取url的host
- 正则表达式获取url中的参数
- JS使用正则表达式获取URL参数
- Python开发:正则表达式获得URL
- python 正则表达式判断URL是否合法
- login.sql 和临时表的一些概念
- [leetcode 136] Single Number
- 浅析结构体函数指针与内核设备驱动
- leetcode笔记:Subsets
- 软件设计模式
- python+正则表达式获取ed2k url
- Android中Activity之间数据传递及返回
- ioctl() 函数用法
- Linux中查看文本文件内容命令cat/tac/nl/more/less/head/tail/vi总结
- Android-Selector实现EditText点击转变风格
- 数据库
- [Python标准库]copy——复制对象
- 修改Apache默认访问目录
- 《设计模式》读书笔记