python实例1--用正则表达式爬取静态网页上的图片
来源:互联网 发布:silverlight for mac 编辑:程序博客网 时间:2024/06/05 20:33
本来使用的是python3配合pycharm,但是编码问题一直有问题,
最开始时是:
TypeError: cannot use a string pattern on a bytes-like object 知道可能是因为python3read()返回的是bytes值而不是string值
加encode()提示:
AttributeError: 'bytes' object has no attribute 'timeout'
要么字符串前加 b' 就是:
'bytes' object has no attribute 'timeout'
要么加.decode('gbk')就是:
'gbk'codec can't decode byte 0x81 in position 18
反正最后调试了很长时间差了好多方法都没有解决,深感无奈切换到了python2.7,刚开始也不行,后来发现是因为虽然新建项目设置的是2.7但是解译器还是3的,之后就可以了。虽然初试pycharm各种毛病不适应,但不得不说界面,coding和安第三方插件时还是很方便的。
目前使用的快捷键有
ctrl+/整体注释和取消注释,
ctrl+Z回撤,
tab缩进,shift+tab取消缩进
其他功能待开发
#coding=utf-8import reimport urllib2url = urllib2.urlopen('http://www.imooc.com/course/list')buf = url.read()bbq = re.compile(r'http:.+\.jpg')abc = bbq.findall(buf)# print(abc)i = 0for a in abc: f = open(str(i)+'.jpg','wb') # 用二进制打开才不会有马赛克 req = urllib2.urlopen(a) b = req.read() f.write(b) i += 1
0 1
- python实例1--用正则表达式爬取静态网页上的图片
- Python爬虫实例(4)-用urllib、re和正则表达式爬取网页图片
- Python爬虫---爬取静态网页的图片
- 爬虫实例:爬取一个网页上的图片地址
- 用JS正则表达式取网页中图片地址
- 正则表达式的应用—爬取网页上的email地址
- 初用正则表达式爬取图片
- Python爬取网页信息时,经常使用的正则表达式及方法
- Python爬取一个网页的图片
- Python爬取一个网页的图片
- python webdriver简单实例:爬取网页图片
- Python 爬虫实例——网页图片爬取
- 用python 爬取网页图片
- python爬取网页图片
- python爬取网页图片
- Python爬取网页图片
- Python爬取网页图片
- Python 爬取网页图片
- html5全屏
- makefile 文件编写规则
- PHP Manual 笔记(更新中)
- hdu 5294 Tricks Device
- mysql数据库C API函数mysql_store_result和mysql_use_result的区别
- python实例1--用正则表达式爬取静态网页上的图片
- Java打印杨辉三角形
- 51nod 活动安排问题之二
- sql 替换字符串 replace用法
- access and faccessat Functions
- 13.1、时间序列实例
- 跟着猫哥学Golang 15 - goroutine
- Delphi BPL包的运用
- 2016年如何保障BAP平台的稳定和高性能的畅想