python爬虫登录豆瓣(一)
来源:互联网 发布:kettle 调用java代码 编辑:程序博客网 时间:2024/05/24 06:22
使用 第三方库 requests
通过使用 chrome 浏览器抓包,可以得到这个请求,将其中的 headers 和 data 提交。最后输出到 douban.html 的文件中,即可查看登录的界面。这次请求是第一次登录,所有界面为提示修改个人信息。
import requestsurl = "https://accounts.douban.com/login"# 将账号和密码改为自己的帐号和密码data = {"source": "None", \ "redir": "https://www.douban.com",\ "form_email": "帐号", \ "form_password": "密码",\ "login": "登录"}headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.106 Safari/537.36",\ "Accept": "text/html,application/xhtml+xml, application/xml;q=0.9",\ "Host": "accounts.douban.com", \ "Referer": "https://accounts.douban.com/login"}r = requests.post(url, data=data, headers=headers)with open("douban_login.html", "w") as f: print(r.text.encode("utf-8"), file=f) # 将网页源代码转化为 utf-8 输出
也可根据相同的原理使用程序修改个人信息。
最后有一个小问题,网页源代码 meta 标签显示编码方式为 utf-8,最后也将字符转化为 utf-8 输出,但保存在本地之后再用浏览器打开却是乱码,将编码方式改为 bg2312 之后就能正常观看,不知道什么原因,求指教 (^o^)/
0 0
- python爬虫登录豆瓣(一)
- python爬虫模拟登录网站(一)-----豆瓣
- python爬虫登录豆瓣(二)
- python爬虫之登录豆瓣
- python爬虫之豆瓣图片(一)
- python爬虫(登录豆瓣并修改签名)
- Python 爬虫个人记录(一)豆瓣电影250
- python爬虫(豆瓣影评)
- Python爬虫实例:登录豆瓣并修改签名
- python豆瓣爬虫由浅入深(1)
- python爬虫之豆瓣图片(二)
- python爬虫豆瓣图片(三)
- python爬虫 豆瓣电影
- python豆瓣电影爬虫
- Python豆瓣爬虫
- python 爬虫 豆瓣韩国电影
- Python 3爬虫小实战(一)—— 豆瓣电影Top250
- Python爬虫实战(一):爬取豆瓣电影top250排名
- GitFlow入门与实践
- JVM区域划分
- iOS开发--SQLite重要框架FMDB的使用
- ubuntu16.04+caffe(CPU only)&hdf5.h: No such file or directory
- HTTP/HLS/RTMP超级负载测试工具
- python爬虫登录豆瓣(一)
- Android基础03--常用控件的认识
- Hive分析函数四
- LSTM神经网络的详细推导及C++实现
- 类类型及空类内存占用浅析
- 网页打印
- 【UVA11992】Fast Matrix Operations——二维线段树
- Linux LVM硬盘管理及LVM扩容
- 微积分中几个重要的不等式:Jensen不等式、平均值不等式、Holder不等式、Schwarz不等式、Minkovski不等式 及其证明