用python免登錄把人人網某個相冊的全部照片下載下來
来源:互联网 发布:表情包文化 知乎 编辑:程序博客网 时间:2024/04/29 15:37
昨天剛開始學python, 老師說不如從爬虫入手,又有成就感又不會無聊,於是就學了最簡單的爬虫,並利用它把自己人人網上面的照片全都下載下來了哈哈。
該程式的代碼如下。
其中myurl是人人網相冊中第一張照片的url,不過我用的是手機版人人網,網址是m.renren.com。
具體如何得到myurl,首先從m.renren.com打開人人網,繼而點進待爬相冊中的第一張照片,這時的url就是myurl了。
# -*- coding: UTF-8 -*-import reimport requestsimport sys#下載人人相冊中的照片#how to set up myurl, please read my blogmyurl='http://3g.renren.com/album/meowmeow'for i in range(1,73+1): #there are 73 photos in this album html=requests.get(myurl) picurl=re.search(' <a href="http://fmn(.*?)">(.*?)</a></p><p class="time">',html.text,re.S).group(1) picurl=re.sub('&','&',picurl) print picurl picurl='http://fmn'+picurl print picurl picture=requests.get(picurl) fp=open('pic\\'+str(i)+'.jpg','wb') fp.write(picture.content) fp.close() myurl=re.search('</p></div><div class="sec"><a href="(.*?)">',html.text,re.S).group(1) myurl=re.sub('&','&',myurl) #get the next url print iprint '======================finish======================'
正則表達式部分,對於不同的頁面,有時候會不一樣。
-----------------------分界網---以下內容與上述內容無關-----------------------
小筆記:.匹配任意字符,\n除外
*匹配前一個字符0次或無限次
?匹配前一個字符0次或一次
.*貪心算法
.*?非貪心算法
\d+匹配數字
()只返回括號內的東西
re.findall
re.search
re.sub
re.S
import requests #提供保存圖片所需東西的模塊
#讀文件f=open('xx.txt','r')html=f.read()f.close()
#存圖片pic=requests.get(url)fp=open('folder\\'+'filename'+'.jpg','wb')fp.write(pic.content)fp.close()
#取得網頁原代碼import requestshtml=requests.get('http://meowmeow')#對於反爬虫的網頁header={'User-Agent':'shgadvvgd'}html=requests.get('http://meowmeow',headers=header)
#對於一些print不出來的東西,可以試試<pre name="code" class="python">print html.encode("gb18030")
#向網頁提交數據mydata={'name':'kalari','password':'naive'}html_post=request.post(url,data=mydata)
info={}info('name')='kalari'info(name)info2=[]info2.append('kalari')
#類class meow(object)<span style="white-space:pre"></span>def __init__(self):<span style="white-space:pre"></span>print 'meow'<span style="white-space:pre"></span>def hello(self):<span style="white-space:pre"></span>print 'hello'if __name__=='__main__':<span style="white-space:pre"></span>kalari=meow()<span style="white-space:pre"></span>kalari.hello()
#xml爬虫from lxml import etreeselector=etree.HTML(html)content=selector.xpath('')#語法'''//根節點/往下找/text()文本內容@xxx屬性內容div[starts-with(@id,"test")]//body/ul[@id="123"]/li/text()無text()info=meow.xpath(string(.))content=info.replace('\n','').replace(' ','')<span style="font-family:Arial, Helvetica, sans-serif;">'''</span>
<span style="font-family:Arial, Helvetica, sans-serif;">#多線程from multiprocessing.dummy import Pooldef getss(url):<span style="white-space:pre"></span>html=request.get(url)if __name__=='__main__':<span style="white-space:pre"></span>pool=Pool(4)<span style="white-space:pre"></span>result=pool.map(getss,urls)<span style="white-space:pre"></span>pool.close()<span style="white-space:pre"></span>pool.join()</span>
<span style="font-family:Arial, Helvetica, sans-serif;">#時間import timetime1=time.time()</span>
0 0
- 用python免登錄把人人網某個相冊的全部照片下載下來
- Python - 获取校内(人人网)的所有好友照片存储到本地
- Python+selenium实现图片网站搜索后下载搜索结果的全部照片
- Python 把蓝底照片转化为白底照片
- #一个无聊的程序#用python调用lame把一个目录下的wav全部转成高音质mp3
- 把一个表里的记录全部用insert打印出来
- 用python写的人人网遍历好友脚本
- ios 获取全部照片
- 把网站原代码全部隐藏的方法
- 把一个数组的组合全部列出
- python实现人人网的自动登录
- python-str的全部函数
- 用itunes把iphoto已导入到iphone的照片怎么删除?
- android camer 图片回显界面照片分享到微博、人人、彩信、蓝牙的功能实现
- 如何把多条语句统计的结果集 用一个存储全部展示
- 如何把普通的五比四的照片做成5寸照片
- 发布软件《人人相片全部下》
- [原创]把你的照片变成故事--PhotoStory3图文教程
- -如何在 Zynq SoC 上使用中断
- bzoj2938——AhoCorasickAutoMata
- 《捉妖记》的命格解析
- 基于JGraphX的通风网络解算---通风网络解算中出现风量为负值的处理
- UVa 1218 - Perfect Service(树形DP)
- 用python免登錄把人人網某個相冊的全部照片下載下來
- android开发布局优化之ViewStub
- 把握linux内核设计思想(七):内核定时器和定时执行
- 黑马程序员——— RuntimeException知识点
- HDU 1004 Let the Balloon Rise
- Hadoop2.7.1集群搭建
- 1133 : 二分·二分查找之k小数
- Window系统打开计算器、截图、画图、记事本、便签等的命令
- 矩形嵌套-记忆化搜索(dp动态规划)