基于Python实现的爬虫源码(1)
来源:互联网 发布:用c语言输出99乘法表 编辑:程序博客网 时间:2024/05/21 17:21
# -*- coding: utf-8 -*-import string,urllib2import osimport shutil#os.rmdir("baidu_file")path = os.getcwd()#os.removedirs(path + '//baidu_file')#shutil.copytree(ResDir,DesDir)#拷贝Dir = path + '//baidu_file'#如果有这个文件夹先删除if os.path.exists(Dir) == True :shutil.rmtree(Dir)#删除文件夹os.mkdir("baidu_file")#新建文件夹os.chdir("baidu_file")#改变当前目录def baidu(url,start_page,end_page):for i in range(start_page,end_page + 1):sName = string.zfill(i,5) + ".html"f = open(sName,'w+')m = urllib2.urlopen(url+str(i)).read()f.write(m)#将字符串写入文件,没有返回值。f.close()print("请输入贴吧地址")bdurl = "http://tieba.baidu.com/p/2296017831?pn="start_page = 1;end_page = 5baidu(bdurl,start_page,end_page)
1 0
- 基于Python实现的爬虫源码(1)
- 基于Python的scrapy框架的广州天气爬虫源码下载
- 基于python的爬虫
- 基于Scrapy框架的python网络爬虫(1)
- 基于Scrapy框架下的Python网络爬虫的实现
- 基于Python、PyQuery实现的一个网络爬虫实例
- 基于Python,scrapy,redis的分布式爬虫实现框架
- Python实现基于协程的异步爬虫(一)
- 基于Python+scrapy+redis的分布式爬虫实现框架
- 基于python的pixiv爬虫
- 关于估价函数的实现-------基于python语言(网络爬虫)
- 异步网络爬虫的Python实现(1)
- 基于Scrapy框架的python网络爬虫学习(2)
- 基于Scrapy框架的python网络爬虫学习(3)
- 基于Scrapy框架的python网络爬虫学习(3)
- 用于网页判断的智能代理技术的简单实现------------基于python实现(网络爬虫)
- [Python]糗事百科的网络爬虫(v0.4)源码
- Python实现简单的爬虫
- What does ContextLoaderListener do in Spring?
- 为view添加阴影效果
- 数据库代理
- mob
- ZOJ 2974Just Pour the Water(矩阵快速幂)
- 基于Python实现的爬虫源码(1)
- libgdx wiki
- boostrap demo
- golang走起(一)对象与指针
- Linux设备驱动安装的基本过程
- 19.php延迟绑定,使用static创建对象
- Spring ContextLoaderListener And DispatcherServlet Concepts
- Ubuntu14.04安装nginx稳定版本步骤
- Spring实现AOP的4种方式