从招聘网站爬取职位信息小窥IT发展
来源:互联网 发布:中国古代数学 知乎 编辑:程序博客网 时间:2024/04/30 06:04
想知道你的工作值多少钱?如果想小范围内转行,转哪个比较好呢?
IT人恐怕逃脱不了加班这个魔咒,有的人想转行,最好是钱多事少离家近。
Snake 从拉勾网爬取职位信息,通过分析城市,职位和薪水的分布的情况,来探讨IT的发展趋势。
虽然数据可能有些不准,“窥一斑而知全豹”。
首先挑几个维度做样本,如下:
cities = np.array(['北京', '上海', '广州', '深圳', '杭州'])
salaries = np.array(['2k-5k', '5k-10k', '10k-15k', '15k-25k', '25k-50k'])
keywords = np.array(["测试", "Android", "IOS", "前端", "人工智能", "后端", "运维"])
翠花,上爬虫!
def get_page(url, page_num, keyword):
headers = {
"User-Agent": "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; AcooBrowser; .NET CLR 1.1.4322; .NET CLR 2.0.50727)",
"Accept": "application/json, text/javascript, */*; q=0.01",
"Content-Type": "application/x-www-form-urlencoded; charset=UTF-8",
"Accept-Encoding": "gzip, deflate, br",
"Accept-Language": "zh-CN,zh;q=0.8"
}
if page_num == 1:
boo = 'true'
else:
boo = 'false'
page_data = {
'first': boo,
'pn': page_num,
'kd': keyword
}
page = requests.post(url=url, headers=headers, data=page_data)
return page.json()
def get_detail(keyword):
final_result = []
for city in cities:
total_count = []
for salary in salaries:
result = get_page(url.format(city, salary), 1, keyword)['content']['positionResult']['totalCount']
total_count.append(result)
final_result.append(total_count)
detail[keyword] = final_result
爬到的数据如下:
图形化,更直观点:
测试
Android开发
IOS开发
前端开发
人工智能
后端开发
运维
PS,原谅我还没完全解决Mac绘图中文字体问题,将就看把。
从数据可以看到,无论哪个岗位,职位最多的非帝都莫属。
杭州超过了广州。(马云功不可没)
各个职位对中级需求相对多些,帝都对15—25K的需求比较大。(帝都的房价,难道是IT人员撑起来的?我知道一个华为的,帝都好几套)
测试和运维的分布很接近。
开发的薪资和测试的薪资,距离没有那么大了。(经过这么多年的发展,开发的薪资已经很理性了。)
人工智能已经起来了,高薪机会很多。(难道是下一个风口,希望不是泡沫)
以上是个人愚见,如有不准,请找招聘网站。我顶多就放了个
阅读全文
0 0
- 从招聘网站爬取职位信息小窥IT发展
- 从招聘网站爬取职位信息小窥IT发展
- Python爬取网站职位信息
- 用Python爬取拉钩网招聘职位信息
- 爬取招聘职位一
- 爬虫:用Python爬取招聘职位信息&职位需求分析
- IT行业招聘职位
- scrapy爬虫实战(二)-------------爬取IT招聘信息
- 爬取招聘信息
- 从招聘网站分析大数据相关职位现状
- webmagic爬取职位信息,新手上路
- 爬取51job的职位信息
- 用Python从智联招聘自动爬取招聘信息
- Scrapy框架爬取腾讯招聘所有职位
- python3小项目——爬取招聘信息(智联招聘)
- java爬取智联招聘职位信息
- 初级数据分析之powershell智联招聘网站统计_北上广招聘职位信息
- 博士职位信息网站
- Struts2学习第三天:访问web元素
- 项目中遇到的问题
- HDU
- 传智_Springmvc+Mybatis由浅入深全套视频教程-SpringMVC笔记(两天)(2017年8月17日21:30:09)
- 二分图匹配 (模板篇)
- 从招聘网站爬取职位信息小窥IT发展
- bzoj 3944 Sum
- 函数实参的计算顺序
- 进制均值(京东2017秋招真题)
- 链表ALDS1-3-C:Doubly Linked List
- 装逼的网站
- 【SSLGZ 2705】2017年8月17日提高组T1 游戏
- 训练日记-13
- ExpandableListView 和SwipeLayout 实现双层列表 ,childitem 滑动删除效果
原创粉丝点击
热门IT博客
热门问题
老师的惩罚
人脸识别
我在镇武司摸鱼那些年
重生之率土为王
我在大康的咸鱼生活
盘龙之生命进化
天生仙种
凡人之先天五行
春回大明朝
姑娘不必设防,我是瞎子
庶女悠然
庶女继妃
庶女难从
望族庶女
庶女嫡
侯门庶女
庶女林璃
庶女txt下载
庶女本色
庶女国色
庶女绾绾
蛇蝎庶女
世家庶女
庶女妖娆
庶女难求
庶女攻略2
相府庶女
庶女难为
庶女王妃
庶女无敌
庶女翻天
庶女殊荣
庶女策繁华
庶女心计
尊贵庶女
庶女有福
明媚庶女
庶女的日常
庶女芳菲
庶女当嫁
庶女生存手册
庶女攻略txt下载
相府庶女王妃不好惹
庶女攻略全文阅读
庶女绝色鬼帝大人求放过
庶女全文阅读
庶女当嫁一等世子妃
庶女狂妃王爷强势宠
天降特工庶女傻后
世家庶女 如小果
庶女毒妃全文免费阅读