程序博客网 > java 获取前一天日期

Scrapy抓取W3C

来源：互联网发布：java 获取前一天日期编辑：程序博客网时间：2024/06/07 06:32

因为web要开卷考试，准备把W3C上的东西爬下来去考试
用最简单的方法：
spider.py:

# -*- coding:utf-8 -*-import scrapyclass W3CSpider(scrapy.Spider):    name='W3C'    start_urls=[            'http://www.w3school.com.cn/html/index.asp',    ]    def parse(self,response):        for href in response.xpath('//div[@id="navsecond"]/div[@id="course"]/ul/li/a/@href'):            yield response.follow(href,self.parse_content)    def parse_content(self,response):        yield{            'content':response.xpath('//div[@id="maincontent"]').xpath('normalize-space(string(.))').extract()[0],        }

注意以下几点：
1.parse函数是提取课程表下的所有链接
这里写图片描述
2.normalize-space（）是去除所有空格和换行
3.提出所有文本

data = response.xpath('//div[@id="example"]')info = data.xpath('string(.)').extract()[0]

info就是<div id="example">标签下所有的文本

阅读全文

0 0

java 获取前一天日期

java 获取前一天日期

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子我有一个好爸爸歌词爸爸生日礼物爸爸生日送什么礼物送爸爸生日礼物给爸爸买什么生日礼物好送爸爸生日礼物推荐爸爸生日礼物送什么好给爸爸买什么礼物好给爸爸生日礼物给爸爸送什么礼物好咋了爸爸是什么歌爸爸让我妈妈给爸爸送什么生日礼物好父亲节送爸爸什么礼物小头爸爸和大头儿2 爸爸生日送什么好送给爸爸生日礼物爸爸生日买什么礼物好爸爸生日买什么礼物给爸爸的生日礼物大头儿小头爸爸全集爸爸妈妈的话爸爸的爷爷叫什么爸爸生日快乐祝福给爸爸的礼物爸爸戒烟作文给爸爸妈妈的话爸爸去哪里了好爸爸洗衣液多少钱给爸爸生日送什么礼物爸爸如何教育孩子爸爸的小宝贝送男朋友爸爸生日礼物送爸爸生日礼物什么好爸爸生日要送什么礼物爸爸写给女儿的信我爸爸我妈妈爸爸的生日礼物好爸爸洗衣液怎么样给爸爸的漂流瓶爸爸生日送什么花好