[Python]网络数据采集概述(3)—穿越网页表单、登录窗口进行采集
来源:互联网 发布:linux 关闭防火墙命令 编辑:程序博客网 时间:2024/06/06 06:41
- Python Requests库提交表单
- 提交文件和图像
- 处理登陆和CookieSessionHttp基本认证
- Cookie
- Session
- HTTP基本接入认证
Python Requests库提交表单
params = {"firstname": "Liu", "lastname": "Vi"}r = requests.post("http://pythonscraping.com/files/processing.php", data=params)print(r.text)
如果不了解字段name、value或者提交的路径,可以通过查看网页源码或者控制台中查看Network
提交文件和图像
files = {'uploadFile': open("1.jpg", 'rb')}r = requests.post("http://pythonscraping.com/files/processing2.php", files= files)print(r.text)
处理登陆和Cookie、Session、Http基本认证
Cookie
params = {"username": "vi", "password": "password"} r = requests.post("http://pythonscraping.com/pages/cookies/welcome.php", data= params) print("Cookie is set to: ") print(r.cookies.get_dict()) print("--------------------") print("Going to profile page...") r = requests.get("http://pythonscraping.com/pages/cookies/profile.php", cookies= r.cookies) print(r.text)
Session
session = requests.Session()params = {'username': 'vi', 'password': 'password'}s = session.post("http://pythonscraping.com/pages/cookies/welcome.php", data= params)print("Cookie is set to: ")print(s.cookies.get_dict())print("-------------------")print("Going to profile page...")s = session.get("http://pythonscraping.com/pages/cookies/profile.php")print(s.text)print(session.headers)print('---------------')print(session.cookies)
HTTP基本接入认证
auth = HTTPBasicAuth('vi', 'password')r = requests.post(url= "http://pythonscraping.com/pages/auth/login.php", auth= auth)print(r.text)
参考书籍:
《Python网络数据采集》
阅读全文
0 0
- [Python]网络数据采集概述(3)—穿越网页表单、登录窗口进行采集
- python网络数据采集-穿越网页表单进行采集
- 《web scraping with python》笔记--穿越网页表单与登录窗口进行采集
- Python爬虫之表单和登录窗口采集
- python网络数据采集
- Python网络数据采集
- Python网络数据采集
- Python网络数据采集
- Python网络数据采集
- Python网络数据采集
- Python网络数据采集
- Python网络数据采集
- Python网络数据采集
- Python网络数据采集
- Python网络数据采集
- python 网络数据采集——媒体文件
- Python网络数据采集——BeautifulSoup
- python网络数据采集-处理登录和cookie
- 使用HTML语言和CSS开发商业站点_利用CSS3制作网页动画
- HDU 4010 Query on The Trees 点权LCT
- codevs1098 均分纸牌
- Qt4.8.5 VS2010 Visual Assist
- hdu1548
- [Python]网络数据采集概述(3)—穿越网页表单、登录窗口进行采集
- 冒泡排序
- 一句SQL完成动态分级查询
- 一次完整的http请求过程
- iOS automaticallyAdjustsScrollViewInsets(自动调整滚动视图)使用
- Json解析网络获取Viewpager图片glide下载图片
- 古典问题:有一对兔子,从出生后第3个月起每个月都生一对兔子,小兔子长到第三个月后每个月又生一对兔子,假如兔子都不死,问每个月的兔子对数为多少?
- 生产报表的自动化实现方案
- Spring中@Configuration和@Bean的作用