python爬虫 ajax请求初使用 豆瓣电影

来源:互联网 发布:淘宝新手卖家被骗 编辑:程序博客网 时间:2024/06/13 18:16

实现用fiddler抓取https://movie.douban.com/typerank?type_name=%E5%89%A7%E6%83%85&type=11&interval_id=100:90&action=下以ajax请求方式的真正的url
这里写图片描述
然后把浏览器滚动条移到底部,浏览器又发出ajax请求:
这里写图片描述

# coding:utf-8import urllibimport urllib2url = "https://movie.douban.com/j/chart/top_list?type=11&interval_id=100%3A90&action="headers = {"User-Agent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36"}startPage = raw_input("请输入开始的页码数:")size = raw_input("请输入每页的数量:")#ajax请求真实url的拼接fullurl = url + "&start=" + str(startPage) + "&limit=" + str(size)request = urllib2.Request(fullurl,headers = headers)response = urllib2.urlopen(request)print response.read()
原创粉丝点击