Python练手项目0013
来源:互联网 发布:殷保华一线法公式源码 编辑:程序博客网 时间:2024/05/16 09:32
本项目采用的是https://github.com/Yixiaohan/show-me-the-code中所提供的练习项目,所有代码均为原创,转载请注明,谢谢。
第 0013 题: 用 Python 写一个爬图片的程序,爬 这个链接里的日本妹子图片 :-)
其代码如下
"""
Created on Tue Feb 7 15:32:39 2017@author: sky
"""
import urllib
import re
import os
url = "http://tieba.baidu.com/p/2166231880"
def catch_pic(url,name):
content = urllib.request.urlopen(url).read()
reg = '<img pic_type="0" class="BDE_Image" src="(.*?)"'
r = re.compile(reg)
picture_list = r.findall(content.decode('utf-8'))
os.mkdir(name)
os.chdir(os.path.join(os.getcwd(),name))
for i in range(len(picture_list)):
picture_name = str(i) + '.jpg'
try:
urllib.request.urlretrieve(picture_list[i],picture_name)
print("success to download" + picture_list[i])
except:
print("fail to download" + picture_list[i])
if __name__ == '__main__':
picture_list = catch_pic(url,'c')
详细代码和结果,可以参考https://github.com/g8015108/exercise-for-python
通过修改reg的正则项可以提取不同的网页图片
0 0
- Python练手项目0013
- python练手项目0005
- Python练手项目0006
- python练手项目0007
- Python练手项目0008
- Python练手项目0009
- Python练手项目0010
- Python练手项目0011
- Python练手项目0012
- Python练手项目
- Python练手项目0014
- Python练手项目0015
- Python练手项目0016
- python练手小项目
- 10个Python练手项目
- 10个python练手项目
- 【Python】 Flask 缘分匹配练手项目
- Python练手项目(来源于知乎)
- spring学习(二)—spring 的bean的实例化方式(通过配置文件)
- Android项目常用内容之底部ViewPager滑动导航
- (四)Redis的数据类型
- C++变量(C++变量定义、变量赋值、命名规则)
- Python中的Classes和Metaclasses详解
- Python练手项目0013
- 使用 CXF 做 webservice 简单例子
- 三字母词和转义字符
- java通过http下载文件
- 用sqlplus的spool导文本文件
- 置信区间(已知样本均值和样本的方差,求总体均值的置信区间)(n < 30)
- [线性规划 对偶 凸包 三分] Codeforces 605C #335 (Div. 1) C. Freelancer's Dreams
- mysql树形结构遍历
- 禁止写入日志