python爬虫

来源:互联网 发布:coc女王数据 编辑:程序博客网 时间:2024/06/06 00:43

抓取steam数据的时候遇到一个问题,获取所有的页面都是英文,首先想到的是添加cookie


wget --load-cookies=cookie_file -O local_file_name http://store.steampowered.com/app/60/

研究了半天的cookie也没有搞定


后来在 it不倒翁 同学的一张关于header的截图上面恍然大悟,添加上头信息,立马ok

 --header="Accept-Language:zh-CN,zh;q=0.8" 


果然没有这种大型项目的经验,关注的点还是太狭窄了。


爬虫地址:https://github.com/glovenone/languages/tree/master/python/website/scrapy


0 0
原创粉丝点击