python爬取京东所有iphone的价格和名称
来源:互联网 发布:淘宝私人定制怎么设置 编辑:程序博客网 时间:2024/04/29 22:19
原本想升一下级,用一下creep神马的,但是正则今天突然出了点小问题,我就生气了,就用正则抓取了一下。
这个正则可以用re.search 或者 re.findall都可以,我比较喜欢用search因为可以直接提取结果不用在过滤了。
代码如下,这个小爬爬比较简单。
#-*- coding:utf-8 -*-import urllib2import jsonimport reSearchIphoneUrl = 'http://search.jd.com/Search?keyword=%E8%8B%B9%E6%9E%9C%E6%89%8B%E6%9C%BA&enc=utf-8&qr=&qrst=UNEXPAND&as_key=title_key%2C%2C%E6%89%8B%E6%9C%BA&rt=1&stop=1&click=&psort=1&page=1'header = {'User-Agent':'User-Agent:Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/31.0.1650.63 Safari/537.36 SE 2.X MetaSr 1.0','Accept':'*/*'}def getHtmlSrc(url,header): req = urllib2.Request(url,header) res = urllib2.urlopen(url,timeout = 5) htmlSrc = res.read() return htmlSrcdef saveHtmlSrc(url): html = getHtmlSrc(url,header) with open('jd_iphone.txt','w') as f: f.write(html)saveHtmlSrc(SearchIphoneUrl)print '++++++++++++++++++++京东放养的爬虫++++++++++++++++++++'with open('jd_iphone.txt','r') as fhtml: localhtml = fhtml.read()#.replace("'",'"').replace(' ','') for skuid in re.findall('<li sku="\d+">',localhtml): #商品编号 sku = skuid.split('"')[1] #手机名称 pname = re.search('''<font class="skcolor_ljg">苹果</font>(.*?)<font class="skcolor_ljg">''',localhtml) # 正则取商品名称html #手机价格 price = re.search('''<strong class="J_%s" data-price="(.*?)">'''%sku,localhtml) if(pname!='' and price!=''): print "商品编号:%s"%sku print "名称:%s\n价格:%s\n\n"%(pname.group(1),price.group(1))print '++++++++++++++++++++京东放养的爬虫++++++++++++++++++++'
0 0
- python爬取京东所有iphone的价格和名称
- Ophone和Iphone的价格PK
- R语言:读取淘宝的单品页的名称和价格
- python serial 获取所有的串口名称
- 获取系统安装的所有打印机名称和驱动名称
- 获取所有wlan的名称和信号量
- hightcharts和highstock的所有图形名称
- iPhone所有设备的屏幕分辨率和像素
- 囚徒困境、价格大战与 iPhone 的价格
- python抓取京东商城的商品名称和价格
- <四>、python爬虫抓取购物网站商品信息--图片价格名称
- iphone开发--获取当前app的名称和版本号
- iphone开发--获取当前app的名称和版本号
- Python 模块的导入 和 模块名称
- 通过SET查看所有环境变量的名称和值
- servlet获取表单提交的所有数据名称和值
- 用Scrapy爬取所有上市公司的股票代码和名称
- 获取所有app的完整包名和activity名称
- hdu2037贪心
- EF实现分页查询+条件查询+排序
- matlab中遇到的一些问题
- 一例 Hive join 优化实战
- Isomorphic Strings
- python爬取京东所有iphone的价格和名称
- (含有头指针以及尾指针)单链表各类功能的实现
- 检测内存泄露
- NSAttributedString 详解
- csdn里面写入自己的源码
- Memory Analyzer 分析内存溢出详解
- 范钢:一堂如何提高代码质量的培训课
- 一文读懂机器学习,大数据/自然语言处理/算法全有了……
- Rails 列表加分页功能