简单使用requests库爬取Ip代理
来源:互联网 发布:网络借贷还不起怎么办 编辑:程序博客网 时间:2024/06/04 19:40
简单使用requests库爬取Ip代理
想必喜欢爬虫的小伙伴都知道,当你刚入门爬虫的时候通过一些基本的方法来访问网站,往往“爬得一时爽”,然而没过多久,IDE便会返回各种各样的错误信息,告诉你,爬虫失败啦,被拦截啦之类的
那么其实呢我们有比较简单的方法来使得你的爬虫稍稍耐久一些,比如多个Ip代理,我们去 好站长 上就能找到啦,但是这么多,你要复制下来弄成一个List,你还要手动打引号和逗号,是不是很繁琐呢?那么我们就用爬虫把它爬下来吧!
首先一贯作案手法,选择一个Ip,然后右键审查元素,可以看到
其中很显然的所有的Ip地址都在<div class="row">
下的<div class="col-xs-12">
里面嘛,(图片看不清的同学可以点击图片放大看)那么我们接下来就用xpath语法来获取这些Ip地址,如果不太熟悉的同学可以去百度一下教程,还是很多的,而且xpath也非常好用
那么我们就输出一波看看是不是有正确爬取到了
然后呢我们发现list里面的元素前面有多余的换行符和空格,那么我们就用re模块给处理掉
这样代码就写好了
我们再打印一波看看
这样就大功告成了~
另外有一个神奇的bug,我用xpath处理之后转成str之后用replace()函数是没有办法把\n去掉的,用re模块里面的sub()方法就可以了….尴尬
1 0
- 简单使用requests库爬取Ip代理
- requests使用代理ip的方法
- requests 使用代理验证
- python3中requests中使用ip代理池随机生成ip
- 基于PYTHON requests包,代理ip+header+延时爬取的简单实现
- 多线程代理ip验证(requests)
- python3中使用requests和beautifulsoup爬取西刺免费代理IP 入库mongo!
- python中requests使用代理proxies
- 怎样使用IP代理
- httpclient使用代理ip
- HttpClient使用代理IP
- htmlunit使用代理IP
- HttpClient使用代理ip
- CURL使用代理IP
- htmlunit使用代理IP
- HttpClient使用代理IP
- HttpClient使用代理IP
- requests有意思的proxies参数-何时使用代理有效
- ViewPager预加载机制
- ios8以前版本UIViewcontroller不兼容,刷新页面后部分控件不显示
- 【软件安全】PAE下虚拟地址到物理地址的转换
- Android 创建一个私有的数据库(内容提供者)
- Python彩蛋import this
- 简单使用requests库爬取Ip代理
- 六角幻方--详解第五届蓝桥杯大赛Java本科B组决赛真题
- RabbitMQ(二)
- javaweb基础----Hibernate+struts2验证用户名和密码是否匹配
- JNIEnv解析
- AOJ.863 分书问题 (DFS)
- 《Cracking the Coding Interview程序员面试金典》----链表A+B
- WPF 使用INotifyDataErrorInfo小例子
- zzulioj 2132 Tmk吃汤饭(模拟)