python 爬虫 知乎
来源:互联网 发布:js跟随鼠标炫酷效果 编辑:程序博客网 时间:2024/04/28 21:47
人生苦短,唯有python
是不是代码写多了自己就熟练了呢?
人人网爬虫模板,具体操作以后有机会再添加吧!
#coding: utf-8import urllib2import urllibimport cookielibimport redef ZhihuBrower(url,user,password): #登陆页面,可以通过抓包工具分析获得,如fiddler,wireshark login_page = "http://www.zhihu.com/login" try: #获得一个cookieJar实例 cj = cookielib.CookieJar() #cookieJar作为参数,获得一个opener的实例 opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cj)) #伪装成一个正常的浏览器,避免有些web服务器拒绝访问。 opener.addheaders = [('User-agent','Mozilla/5.0 (Windows NT 6.3; WOW64; rv:36.0) Gecko/20100101 Firefox/36.0')] #伪装成内部访问 opener.addheaders = [('Refer','http://www.zhihu.com/')] #生成Post数据,含有登陆用户名密码。 data = urllib.urlencode({"email":user, "password":password}) #以post的方法访问登陆页面,访问之后cookieJar会自定保存cookie opener.open(login_page,data) #以带cookie的方式访问页面 op=opener.open(url) #读取页面源码 data= op.read() return data #异常处理 except Exception,e: print str(e)#访问某用户的个人主页,其实这已经实现了人人网的签到功能。html = ZhihuBrower("http://www.zhihu.com/",'544705740@qq.com','********')print htmlprint '-----end--------'
0 0
- python 爬虫 知乎
- python爬虫知乎
- [Python] 知乎多线程爬虫
- 用python爬虫抓取知乎图片
- python Requests 知乎问题图片爬虫
- python 爬虫——登录知乎
- [python]知乎用户头像爬虫
- Python爬虫模拟登陆知乎
- Python 爬虫模拟登陆知乎
- Python爬虫之模拟登陆知乎
- Python爬虫之知乎图片抓取
- Python爬虫模拟登陆知乎
- 知乎爬虫
- 知乎爬虫
- 知乎爬虫
- 知乎图片爬虫
- JAVA知乎爬虫
- 知乎爬虫
- 在juqery的ajax和struts2整合开发时,对象数据的从页面到Action的传递问题
- Remove Nth Node From End of List 删除链表倒数第N个节点
- 动态添加输入框
- 第四周 程序阅读——构造函数和析构函数(三)
- CocoaPods的使用(xcode创建的IOS应用中引入第三方类库:在同一目录下pod install/update)
- python 爬虫 知乎
- 再探MFC(一)基于对话框的MFC应用程序项目框架
- Valid Parentheses 合法的匹配 栈实现
- Java_socket程序学习03-一个客户端对一个服务器-交互(服务器端)--01
- 文库年度图书精选会第四期:Web开发精选30本
- App store最新审核标准公布
- 新浪微博开发之十四(AFNetworking的使用 )
- 教你透彻了解红黑树
- html中引入css方式