scrapy中文存储

来源:互联网 发布:阿里云 青云 ucloud 编辑:程序博客网 时间:2024/06/16 05:53

修改setteings文件

ITEM_PIPELINES = {      'mypjt.pipelines.MypjtPipeline': 300, 6 }

编写pipelines文件

# -*- coding: utf-8 -*-import codecs# Define your item pipelines here## Don't forget to add your pipeline to the ITEM_PIPELINES setting# See: http://doc.scrapy.org/en/latest/topics/item-pipeline.htmlclass MypjtPipeline(object):    def __init__(self):        self.file = codecs.open("mydata1.txt","wb",encoding = "utf-8")    def process_item(self, item, spider):        #i=json.dumps(dict(item),ensure_ascii=False)当存储json格式时        l = str(item)+'\n'        print(l)        self.file.write(l)        return item    def close_spider(self,spider):        self.file.close()

spider代码

# -*- coding: utf-8 -*-import scrapyfrom mypjt.items import MypjtItemclass MyspdSpider(scrapy.Spider):    name = 'myspd'    allowed_domains = ['sina.com.cn']    start_urls = ['http://tech.sina.com.cn/d/s/2016-09-17/doc-ifxvyqwa3324638.shtml']    def parse(self, response):        item = MypjtItem()          item["title"] = response.xpath("/html/head/title/text()") #当存储json格式时后面加extract()即可        print (item["title"])        yield item                #对item进行迭代,否则文件中将为空
原创粉丝点击
热门问题 老师的惩罚 人脸识别 我在镇武司摸鱼那些年 重生之率土为王 我在大康的咸鱼生活 盘龙之生命进化 天生仙种 凡人之先天五行 春回大明朝 姑娘不必设防,我是瞎子 喉咙咽口水都疼怎么办? 舌头上长了溃疡怎么办 包包的拉链坏了怎么办 做试管取精困难怎么办 sw过膝靴往下掉怎么办 如果被绑架了该怎么办 怀孕了%2c怎么办%3f 狗狗拉肚子怎么办带血 同学们不和我玩怎么办 懒癌和拖延症怎么办 有严重的拖延症怎么办 有拖延症的人怎么办 10多天月经不停怎么办 20多天月经不停怎么办 月经来了十几天不停怎么办 例假20多天不停怎么办 苹果6dns被劫持怎么办 工地欠工资不给怎么办 买的狗得病了怎么办 剖腹产9天刀口痒怎么办 剖腹产6天刀口痒怎么办 剖腹产2年刀口痒怎么办 破腹产9天刀口痒怎么办 破腹产7天刀口痒怎么办 剖腹产8天伤口痒怎么办 刨腹产9天刀口痒怎么办 破腹产8天刀口痒怎么办 二胎刀口1.1mm薄怎么办 土豪养成记2闪退怎么办 爱上不该爱的人怎么办? 有妇之夫爱上我,怎么办 全身起疙瘩很痒怎么办 怀孕了肚子很痛怎么办 月经来肚子疼的厉害怎么办 孕妇9个月肚子疼怎么办 斗鱼身上长白点怎么办 8个月宝宝肚子疼怎么办 1岁半宝宝肚子痛怎么办 3岁宝宝肚子疼怎么办啊 吃的太辣肚子疼怎么办 2岁半宝宝肚子疼怎么办