程序博客网 > ubuntu虚拟机无法上网

串行爬虫sequentipl

来源：互联网发布：ubuntu虚拟机无法上网编辑：程序博客网时间：2024/06/07 13:00

from link_crawler import link_crawlerfrom mongo_cache import MongoCachefrom alexa_cb import AlexaCallbackdef main():    scrape_callback = AlexaCallback()    cache = MongoCache()    link_crawler(scrape_callback.seed_url, scrape_callback=scrape_callback, cache=cache)if __name__ == '__main__':    main()

注意：报pymongo.errors.OperationFailure: exception: Index with name: timestamp_1 already exists with different options时，需要注掉mongo_cache中的

self.db.webpage.create_index('timestamp', expireAfterSeconds=expires.total_seconds())

阅读全文

0 0

ubuntu虚拟机无法上网

ubuntu虚拟机无法上网

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子天府行江应景林容免费阅读应寒年林宜全文阅读江应景林蓉应寒年林宜免费阅读江应景林容第32章江应景林容目录林应强遥寄相思与明月林容江应景小燕痛风应少吃什么减肥应少吃什么羊水偏少应注意什么月经量少应吃什么应届生是什么意思应届生什么意思国考应届生应届生简历什么是应届生应届生自我介绍应届生面试上海应届生落户怎么才算应届生应届生考公务员应届生招聘会应届生是什么应届生就业 bbs应届生应届生求职网bbs 应届生网站应届生招聘信息网应届生招聘网站应届生论坛应届生bbs 应届生招聘应届生银行招聘银行招聘应届生应届生 bbs 金融应届生招聘应届生实习应届生实习应届生身份