用scrapy实现文件的下载
来源:互联网 发布:禁用windows defender 编辑:程序博客网 时间:2024/06/06 02:54
网上给的很多例子都是爬取图片并下载图片,我主要讲述一下如何利用scrapy下载网站中的附件,以PDF文件为例进行讲解。
我的环境如下:
Python 3.6.0 |Anaconda custom (32-bit)| (default, Dec 23 2016, 12:06:52) [MSC v.1900 32 bit (Intel)] on win32
Scrapy 1.4.0
例如:下载下面链接的一个PDF文件。
http://xinpi.cs.com.cn/new/file/bulletin/2017/7/11/1203693682.PDF
>>> import urllib.request>>> attachment_url = 'http://xinpi.cs.com.cn/new/file/bulletin/2017/7/11/1203693682.PDF'>>> file_path = 'attachment\\1.pdf' # 此处特别注意处理转义字符,'\1'表示>>> urllib.request.urlretrieve(attachment_url, file_path) # 第一个参数表示下载的链接,第二个参数表示存储的路径
在这段代码中要注意import urllib.request
,如果只是导入urllib
,会报错,如https://stackoverflow.com/questions/22278993/attributeerror-module-object-has-no-attribute-request所示。
阅读全文
0 0
- 用scrapy实现文件的下载
- 文件下载的实现
- 文件下载的实现
- 实现Scrapy的Demo
- 用C++实现下载文件的功能
- struts文件下载的实现
- 实现文件的下载上传
- FileReference 实现文件的下载
- Android 实现文件的下载
- Android 实现文件的下载
- Android 实现文件的下载
- java文件下载的实现
- java实现文件的下载
- Servlet实现文件的下载
- Servlet实现文件的下载
- PHP实现文件的下载
- HttpServlet实现文件的下载
- html实现文件的下载
- iOS开发笔记之NSMutableAttributeString富文本
- mount挂载使用(嵌入式开发)
- Oracle大小写转换函数
- Host 'XXX' is not allowed to connect to this MySQL server 解决方案
- web开发 php之 socket(TCP/IP)原理 学习、理解和应用
- 用scrapy实现文件的下载
- java签名字母排序
- 玩转GridView
- Android TextView自动换行文字排版参差不齐的原因
- mybatis集成spring
- shell随机抽样若干行
- RESTful架构详解
- 操作系统常用调度算法
- 13、层次选择器