016讲五行爬虫网站图片,视频代码
来源:互联网 发布:中英文对照阅读软件 编辑:程序博客网 时间:2024/05/17 04:05
一图片代码
import urllib.request
import re
for page in range(254,256):
req = urllib.request.Request("http://jandan.net/ooxx/page-%s#comments"%page) #请求
req.add_header("user-agent","Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36Core/1.53.3226.400 QQBrowser/9.6.11681.400")
for i in re.findall(r'img src="(.*?)"',urllib.request.urlopen(req).read().decode('utf-8')): #匹配
j = "http:"+ i
file_name =i.split("/")[-1]
urllib.request.urlretrieve(j,'正则下载/%s'%file_name) #下载的方法
2.视频代码详解
import urllib.request
import re
def getvideo(page):
req = urllib.request.Request("http://www.budejie.com/video/%s"%page) #请求
req.add_header("User-Agent","Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36 Core/1.53.3226.400 QQBrowser/9.6.11681.400")
html = urllib.request.urlopen(req).read().decode('utf-8') #响应与解码
reg = r'data-mp4="(.*?)"'
for i in re.findall(reg,html): #匹配
#print('正在下载:%s'% i)
file_name =i.split("/")[-1]
urllib.request.urlretrieve(i,'爬虫视频/%s'%file_name) #下载的方法
for i in range(1,11):
getvideo(i)
- 016讲五行爬虫网站图片,视频代码
- 013讲爬虫网站图片
- 十五行代码爬取百思不得姐网站数百视频
- python 爬虫视频网站
- python爬虫网站图片
- python 爬虫视频网站(二)
- 五行代码的疑惑
- 滚动程序五行代码
- 二分法五行核心代码
- 抓蜂鸟网站图片爬虫
- python 爬虫下载网站图片
- python 爬虫某网站图片
- 下载图片、视频代码
- 二分查找 (代码五行)
- 五行代码 ----道不出的屌丝苦
- python实现虎扑网站图片爬虫
- python 实现网站图片抓取小爬虫
- java实现爬虫爬网站图片
- C++ rapidxml的使用
- php 的数据强制类型转换和默认类型转换
- 寄存器-基本概念
- MySQL入门很简单-MySQL数据类型
- zuul源码分析
- 016讲五行爬虫网站图片,视频代码
- 网页设计师的7大必备技能
- Java HelloWorld
- tomcat发布相关的知识
- C++运算符重载讲解与经典实例
- 据说一个成功的研发团队应具备这9大属性
- python中json模块的用法
- 错误ORA-28040:没有匹配的验证协议&&错误ORA-12541:无监听程序
- Android 如何通过java反射得到build.prop的键值对