【原创】python spider …
来源:互联网 发布:js的相对定位 编辑:程序博客网 时间:2024/05/21 05:22
爬取新浪微博的数据,验证码是个问题,很痛苦,又没钱找外包验证码团队,又没技术搞定新浪或者腾讯的验证码,于是乎,费了多少功夫不用说了,只能估模测试搜索限制,愁人。关键代码如下:
import time
#... You Codeimport random
n = random.choice([1,2,3,3,3,3,4,4,4,4,4,5,5,5,5,5,5,10])#从列表中选择随机数
print 'while sleep time: %ss ...'% n
print 'while sleep time: %ss ...'% n
time.sleep(n)
#...You Code
新浪微博验证码处理,考虑到效率,还要考虑到验证码承受范围,只能大概控制翻页的时间范围。
之前吧,30 - 40 页绝对要出验证码,很烦人,这个设置后 Never !
0 0
- 【原创】python spider …
- 【原创】Python Spider …
- 【原创】python try cat…
- 【原创】python The pac…
- 【原创】 linux-python …
- 【原创】 linux-python …
- 【原创】 linux-python …
- 【原创】 linux-python …
- 【原创】 linux-python …
- 【原创】 linux-python …
- 【原创】 python django…
- 【原创】 linux-python …
- 【原创】 python django…
- 【原创】 python django…
- 【原创】 linux-python …
- 【原创】 linux Python&…
- 【原创】Python True Fa…
- 【原创】Python 定时器 …
- java实现图片水平翻转
- 【原创】简单的python多线程队列
- 有些人,注定一辈子不会忘;有些人…
- 世人笑我太疯癫,我笑世人看不穿
- Eclipse远程调试Tomcat
- 【原创】python spider …
- 【原创】 linux-python …
- Unity手游性能测评报告——MOBA篇
- 【原创】 python MySQLdb 异常总结
- 【原创】最新最全的省市县三级表
- OpenCV检测斑马线
- 设计了一个Mysql数据库
- 【原创】mysql 常见导入导出用法
- 【原创】有想打开却打不开的网页吗…