筛选出可用的代理+刷百度博客访问量+ip正则表达式
来源:互联网 发布:java instance单例 编辑:程序博客网 时间:2024/05/23 02:24
#! /usr/bin/env python#coding=utf-8import reimport myThreadwhile myThread.proxy.empty()==False: myThread.proxy.get()fp=open("c:\\1.txt","r")file_content=fp.read()fp.close()pattern=r"(?:(?:\d|[1-9]\d|1\d\d|2[0-4]\d|25[0-5])\.){3}(?:\d|[1-9]\d|2[0-4]\d|25[0-5]):\d{1,4}"#用于匹配(ip:prot)r=re.compile(pattern)Sock=r.findall(file_content)for p in Sock:#将所有的代理加入队列 myThread.proxy.put(p)myThread.availableThread=50#开启50个线程for i in range(myThread.availableThread): t1=myThread.mThread(str(i)) t1.start()myThread.proxy.join()#等待直到队列为空,此时proxy被处理完Sock=[]while myThread.newProxy.empty()==False: Sock.append(myThread.newProxy.get())fp=open("c:\\1.txt","w")for p in Sock: s=str(p).split(r'//')[1]#获取(ip:prot)部分 s=s.split('\'')[0] fp.write(str(s)+"\n")#将可用的代理写入文件fp.close()
#! /usr/bin/env python#coding=utf-8import urllib2,time,reimport urllib2,cookielibimport urllib, time, sysfrom threading import Threadimport Queueimport thread,socketproxy=Queue.Queue()newProxy=Queue.Queue()count=0availableThread=0class mThread(Thread): def __init__(self,threadname): Thread.__init__(self)#初始化父构造函数 self.cookie=cookielib.CookieJar()#cookie self.opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(self.cookie)) urllib2.install_opener(self.opener) self.name=threadname self.lock=thread.allocate_lock()#临界区域锁 socket.setdefaulttimeout(5)#设置超时时间为5s def run(self): global proxy,newProxy while True: if proxy.qsize()==0:#当没有可用的代理的时候推出 print "not proxy availabe!" self.lock.acquire()#进入临街区域 global availableThread availableThread-=1 print "可用线程数",availableThread self.lock.release()#离开临界区域 sys.exit(1) self.lock.acquire() global count count=count+1 print "已使用代理",count," 可用:",proxy.qsize() self.lock.release() sock=proxy.get()#从待检查的代理中获取代码 self.MYPROXY={'http':'http://'+sock}#使用当前的代理 try: h=urllib.urlopen(r'http://www.google.com.hk',proxies=self.MYPROXY)#建立url连接 ll=h.read()# ll.close() print self.MYPROXY,"__",self.name newProxy.put(self.MYPROXY)#加入到可用的代理中 except IOError: print "Error",sock proxy.task_done()#当前队列元素用好了if __name__=='__main__': mThread.start()
改装后可用于刷百度空间的流量
#! /usr/bin/env python#coding=utf-8import urllib2,time,reimport urllib2,cookielibimport urllib, time, sysfrom threading import Threadimport thread,socketcount=0class mThread(Thread): def __init__(self,threadname): Thread.__init__(self)#初始化父构造函数 self.cookie=cookielib.CookieJar()#cookie self.opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(self.cookie)) urllib2.install_opener(self.opener) self.name=threadname self.lock=thread.allocate_lock()#临界区域锁 socket.setdefaulttimeout(5)#设置超时时间为5s fp=open("c:\\1.txt","r") file_content=fp.read() fp.close() pattern=r"(?:(?:\d|[1-9]\d|1\d\d|2[0-4]\d|25[0-5])\.){3}(?:\d|[1-9]\d|2[0-4]\d|25[0-5]):\d{1,4}"#用于匹配(ip:prot) r=re.compile(pattern) self.proxy=r.findall(file_content) def run(self): for p in self.proxy: self.MYPROXY={'http':'http://'+p}#使用当前的代理 try: h=urllib.urlopen(r'http://hi.baidu.com/ckl_soft/item/9971ab21a031f157c28d5977',proxies=self.MYPROXY)#建立url连接 ll=h.read() # ll.close() global count print self.MYPROXY,"__",self.name,"__",count self.lock.acquire() count=count+1 self.lock.release() except IOError: print "没响应",pif __name__=='__main__': mThread.start()
#! /usr/bin/env python#coding=utf-8import reimport myThreadfor i in range(50): myThread.mThread(str(i)).start()
- 筛选出可用的代理+刷百度博客访问量+ip正则表达式
- 正则表达式筛选出字符串中的ip地址
- 正则表达式筛选出jpg、png的图片url
- java正则表达式筛选字符串中的ip
- Python 3.6 正则表达式二 包含筛选IP正则表达式
- QT 用正则表达式从tableView中筛选出某一日期范围内的数据
- 如何刷博客的访问量
- 如何刷博客的访问量
- iP的正则表达式
- iP的正则表达式
- ip的正则表达式
- C#设置代理IP及刷网站访问量demo
- 移动可用代理ip
- Linux IP代理筛选系统
- python多线程筛选代理ip
- python刷博客访问量
- 正则表达式筛选数据 表达式语法 自己总结的
- 正则表达式的博客[收藏]
- C语言总结
- POJ1724 价格合适的最短路(广搜BFS)
- 切线空间(tangent space)
- oracle创建简单的outline
- 大骂邻居家阿姨
- 筛选出可用的代理+刷百度博客访问量+ip正则表达式
- silverlight 获取控件间的相对位置
- SWT 的字体(Font)、颜色(Color)、图像(Image)和绘图
- c++调用python总结
- NEFU 115 斐波那契的整除
- 数据库顶级会议——ACM SIGMOD/PODS、VLDB会议介绍
- Eclipse中的文件系统
- Java高新技术
- Box2d源码学习<四>数学库API的实现