ganon库实战--根据class抓取京东价格和图片
来源:互联网 发布:人工智能 医疗机器人 编辑:程序博客网 时间:2024/04/27 22:01
前言
最近有个小需求,希望能根据京东商品页面抓取到对应的价格和商品图片,我们都知道有很多专业开源爬虫库。这次尝试体验了ganon库,简单好用,推荐值得一试。
特点是可以类似css类选择器那样选择元素,如要选择class="big-price"的span元素:span[class="big-price"。选中元素后可以获取到自己所需的内容。基本就等同于js操作html元素。
官网: (https://code.google.com/archive/p/ganon//)
实战目标
获取地址中的图片和价格
源码:
<?phpinclude 'ganon.php';$html = file_get_dom("http://item.m.jd.com/product/10875285.html");$pic = [];// $price = '';foreach ($html('span[class="big-price"]') as $element) {$price = ($element->getInnerText());}foreach ($html('span[class="small-price"]') as $element) {$price .= ($element->getInnerText());}var_dump($price);foreach ($html('img[class="J_ping"]') as $element) {$pic[] = 'http:'.trim($element->attributes['src']);}var_dump($pic);
执行结果:
$ php test.php string(6) "101.10"array(1) { [0]=> string(81) "http://m.360buyimg.com/n12/15093/2a690799-c814-4784-9027-b21e688415ff.jpg!q70.jpg"}
轻轻松松完美搞定!
1 0
- ganon库实战--根据class抓取京东价格和图片
- 淘宝数据抓取1.0-根据url抓取尺码和价格
- python抓取京东商城的商品名称和价格
- python beautifulsoup抓取京东商品名称和价格
- java 输入输出--抓取凡客一万多商品名称和价格,图片~用到的
- KNN实现京东价格抓取
- python抓取京东价格分析京东商品价格走势
- 抓取淘宝某类商品名称和价格
- 抓取凡客一万多商品,链接,商品名称,价格,图片~~~版本1
- <四>、python爬虫抓取购物网站商品信息--图片价格名称
- 抓取京东手机图片
- Python爬虫学习之抓取商品名称和价格
- 最新抓取淘宝价格数据,图片标题的就更好抓了整合就好
- 价格和价格规则
- 360Buy 京东商城商品价格图片识别 火车头采集京东商城图片价格识别
- Python爬虫实战(1)——百度贴吧抓取帖子并保存内容和图片
- python爬虫实战(1)抓取网页图片自动保存
- 根据销量排序,获取商品的数据(价格,名称,url,商品图片)
- 欧拉工程第15题 从20*20的网格的左上角通往右下角有多少条路
- 指针函数与函数指针
- Spring深入使用(一)
- Linux环境搭建Hadoop伪分布模式
- HDU_1263_水果
- ganon库实战--根据class抓取京东价格和图片
- AutoFillAdjustChildAdapterOption--RecycleViewUtil之动态计算均分控件显示childView
- jsp实现网站计数器
- LDA主题模型小结
- linux进程调度介绍
- C语言基本数据类型
- Nginx安装手册
- 《放牛班的春天》影评
- 逻辑思维-高手是怎样炼成的