爬取人人贷
来源:互联网 发布:人事软件下载 编辑:程序博客网 时间:2024/05/05 21:18
import sys reload(sys) sys.setdefaultencoding("utf-8") import urllib2 import urllib import re import pandas as pdimport numpy as npimport matplotlib.pyplot as plturl='https://www.we.com/loan#page-'title=[]amount=[]interest=[]months=[]for i in range(1,52): url = url + str(i) myPage = urllib2.urlopen(url).read() html=myPage.decode('utf-8') a=re.findall(r'"title":(.*?),',html) #提取title字段 b=re.findall(r'"amount":(.*?),',html) c=re.findall(r'"interest":(.*?),',html) d=re.findall(r'"months":(.*?),',html) title.extend(a) amount.extend(b) interest.extend(c) months.extend(d)#转换字段类型rrd=pd.DataFrame({'title':title,'amount':amount,'interest':interest,'months':months})rrd[['amount','interest','months']]=rrd[['amount','interest','months']].astype(np.float64)title_count=rrd.groupby('title')['amount'].agg('count')title_sum=rrd.groupby('title')['amount'].agg('sum')#print title_count#print title_sumplt.rc('font', family='STXihei', size=10)a=np.array([1,2,3,4,5])plt.figure()#此处双向条形图无法实现,存疑。是否可以建2张图,然后共用y轴plt.barh(a,title_count, color = 'r',align='center', alpha = .5)plt.barh(a,-title_sum, color = 'b',align='center', alpha = .5)plt.ylabel('贷款用途分类')plt.title('贷款用户金额及笔数')plt.xticks(a,(''))plt.yticks(a,('扩大生产/经营','教育培训','日常生活消费','装修','资金周转'))plt.show()
0 0
- 爬取人人贷
- 利用python爬取人人贷网的数据
- 人人网从美国引入“人人贷”
- java爬取人人网数据
- 自动化爬取开开贷借贷黑名单(python&selenium)
- python爬虫selenium爬取开开贷黑名单
- python爬虫scrapy之贷联盟黑名单爬取
- 人人贷获1.3亿美元
- 人人取反
- Python爬虫:爬取人人都是产品经理的数据
- 打印图形:人人贷测试岗面试题(20171103)
- 乐金所、拍拍贷、人人贷:平民如何做好P2P理财
- 网贷平台数据分析爬取并存入mysql,生成csv
- 人人code,整数取反
- 人人code,整数取反
- 人人code, 整数取反。
- 人人code,整数取反
- 拉取人人直播流
- unicode、utf-8、ansi的故事
- 关于Python的一些网址
- C#学习第一天(整理自c#入门经典)
- spark 统计单词个数
- Java 基础
- 爬取人人贷
- MATLAB2016A安装vlfeat
- bzoj1717: [Usaco2006 Dec]Milk Patterns 产奶的模式[后缀数组]题解②
- 探秘身份认证利器——声纹识别!
- Android的设计与实现--读书笔记
- Rat Attack POJ - 1916
- javaweb开发模式
- javascript数据隐式转换详解与分析
- SqlServer2008T-Sql收缩数据库日志文件