mac 上python简易爬虫
来源:互联网 发布:域名买卖网 编辑:程序博客网 时间:2024/05/21 10:44
代码主要copy叶孤城大大。
http://www.imooc.com/wenda/detail/248578
1.三方库
安装 BeautifulSoup 很简单,下载 BeautifulSoup 源码。解压运行
python setup.py install 即可。(ps 若出现权限问题错误 sudo python setup.py install )
2. BeautifulSoup版本(4.0+以上from bs4 import BeautifulSoup) python采用mac内置版本2.7
若BeautifulSoup版本 低于4.0 采用 from BeautifulSoup import BeautifulSoup(html解析)
#!/usr/bin/python#-*- coding: utf-8 -*-#encoding=utf-8import urllib2import urllibimport osfrom bs4 import BeautifulSoup#导入库,Python代码与swift很相似,学过的同学比较快捷#def 定义一个函数,ps python定义变量不需要使用js或swift的vardef getAllImageLink(): i=1; #while循环 while(i<10): #http://www.dbmeizi.com/category/11?p=0 小清新,可打开,该句获取html html = urllib2.urlopen('http://www.dbmeizi.com/category/11?p=%s'%(i-1)).read() i=i+1; #html = urllib2.urlopen('http://www.dbmeizi.com').read() soup = BeautifulSoup(html) #find li标签下class=span3 liResult = soup.findAll('li',attrs={"class":"span3"}) for li in liResult: imageEntityArray = li.findAll('img') #find img标签 for image in imageEntityArray: link = image.get('data-src') imageName = image.get('data-id') #下载路径,每个人路径不一样,建议修改,本人放在桌面上 filesavepath ='/Users/nothinglhw/Desktop/Mypic/%s.jpg' % imageName #下载图片 urllib.urlretrieve(link,filesavepath) print filesavepathif __name__ == '__main__': getAllImageLink()
#ps:
在cmd 中直接运行.py文件,则__name__的值是'__main__';
而在import 一个.py文件后,__name__的值就不是'__main__'了;
从而用if __name__ == '__main__'来判断是否是在直接运行该.py文件
0 0
- mac 上python简易爬虫
- Python简易的爬虫
- Python初级简易爬虫
- python简易爬虫制作
- python简易爬虫
- python简易爬虫
- python实现简易采集爬虫
- python实现简易采集爬虫
- python编写的简易爬虫
- python实现简易网络爬虫
- 2015.12.25Python 简易爬虫-
- Python简易百度百科爬虫
- 简易python爬虫--修真四万年
- Python简易爬虫,爬取斗鱼颜值美女!!
- 爬虫系列1:python简易爬虫分析
- Python 爬虫入门《上》
- 【简易Python爬虫】 初试爬虫_简易Python图片爬虫实现
- Python简易爬虫以及嵌套数据类型
- Spring深入浅出(二)IOC详解
- Apache配置详解(最好的APACHE配置教程)
- notepad的技巧性问题
- 软件测试工具
- Maven原理和Maven2新特性
- mac 上python简易爬虫
- 你的能量超乎想象-记2014.9-2015.2
- libxl库的使用
- 干支纪年,2015为什么是乙未年?
- HDU 4291解题报告
- Android API之android.provider.ContactsContract.Contacts
- Lucene学习总结之一:全文检索的基本原理
- Android API之android.provider.ContactsContract
- C/C++ 中typedef 用法总结