python 爬虫demo
来源:互联网 发布:muse for mac 编辑:程序博客网 时间:2024/06/06 00:50
3.3版如下
import re
from urllib import request
def getHtml(url):
headers = {‘User-Agent’: r’Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) ‘,
‘Referer’: r’http://www.lagou.com/zhaopin/Python/?labelWords=label‘,
‘Connection’: ‘keep-alive’
}
req = request.Request(url, headers=headers)
page = request.urlopen(req).read()
page = page.decode(‘utf-8’)
return page
def getImg(html):
reg = r’src=”(.+?.jpg)” pic_ext’
imgre = re.compile(reg)
imglist = re.findall(imgre,html)
return imglist
html = getHtml(“http://tieba.baidu.com/p/2460150866“)
print(getImg(html))
f=open(‘f.txt’,’w’)
html2 = ” “.join(getImg(html))
f.write(html2)
f.close()
2.7版如下
import re
import urllib
def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return html
def getImg(html):
reg = r’src=”(.+?.jpg)” pic_ext’
imgre = re.compile(reg)
imglist = re.findall(imgre,html)
return imglist
html = getHtml(“http://tieba.baidu.com/p/2460150866“)
print getImg(html)
f=open(‘f.txt’,’w’)
html2 = ” “.join(getImg(html)) //列表转字符串
f.write(html2)
f.close()
- python 爬虫demo
- python爬虫demo
- Python爬虫demo
- python 爬虫demo
- Python爬虫简单的demo
- python 网络爬虫(一) 简单demo
- Python爬虫原理的小demo
- python爬虫之BeautifulSoup小demo
- 爬虫demo
- python爬虫实现简单爬取淘宝商品demo
- python爬虫实现网络股票信息爬取的demo
- java 爬虫Demo
- 网页爬虫简单demo
- Android 网络爬虫demo
- Scrapy爬虫Demo
- webcollector爬虫demo
- PY爬虫Demo集合
- Java小爬虫Demo
- MySQL高级教程--目录结构01
- ABAP 如何查找事务代码所在程序的用户出口
- MSSQL-Scripter,一个新的生成T-SQL脚本的SQL Server命令行工具
- SDUT 3363 数据结构实验之图论七:驴友计划(最短路)
- Android 常驻进程保活自启动方案总结
- python 爬虫demo
- 约瑟夫环
- DB太大?一键帮你收缩所有DB文件大小(Shrink Files for All Databases in SQL Server)
- Configure Red Hat Enterprise Linux shared disk cluster for SQL Server
- 从4行代码看右值引用
- 编程第八十二天
- 开发的总结
- mui选项卡跳转问题
- 立体匹配之代价聚合