从招聘网站爬取职位信息小窥IT发展
来源:互联网 发布:node.js搭建 编辑:程序博客网 时间:2024/04/30 03:48
想知道你的工作值多少钱?如果想小范围内转行,转哪个比较好呢?
IT人恐怕逃脱不了加班这个魔咒,有的人想转行,最好是钱多事少离家近。 Snake 从拉勾网爬取职位信息,通过分析城市,职位和薪水的分布的情况,来探讨IT的发展趋势。
虽然数据可能有些不准,“窥一斑而知全豹”。
首先挑几个维度做样本,如下:
cities = np.array(['北京', '上海', '广州', '深圳', '杭州'])salaries = np.array(['2k-5k', '5k-10k', '10k-15k', '15k-25k', '25k-50k'])keywords = np.array(["测试", "Android", "IOS", "前端", "人工智能", "后端", "运维"])
翠花,上爬虫!
def get_page(url, page_num, keyword): headers = { "User-Agent": "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; AcooBrowser; .NET CLR 1.1.4322; .NET CLR 2.0.50727)", "Accept": "application/json, text/javascript, */*; q=0.01", "Content-Type": "application/x-www-form-urlencoded; charset=UTF-8", "Accept-Encoding": "gzip, deflate, br", "Accept-Language": "zh-CN,zh;q=0.8" } if page_num == 1: boo = 'true' else: boo = 'false' page_data = { 'first': boo, 'pn': page_num, 'kd': keyword } page = requests.post(url=url, headers=headers, data=page_data) return page.json()def get_detail(keyword): final_result = [] for city in cities: total_count = [] for salary in salaries: result = get_page(url.format(city, salary), 1, keyword)['content']['positionResult']['totalCount'] total_count.append(result) final_result.append(total_count) detail[keyword] = final_result
爬到的数据如下:
图形化,更直观点:
测试
Android开发
IOS开发
前端开发
人工智能
后端开发
运维
PS,原谅我还没完全解决Mac绘图中文字体问题,将就看把。
从数据可以看到,无论哪个岗位,职位最多的非帝都莫属。
杭州超过了广州。(马云功不可没)
各个职位对中级需求相对多些,帝都对15--25K的需求比较大。(帝都的房价,难道是IT人员撑起来的?我知道一个华为的,帝都好几套)
测试和运维的分布很接近。
开发的薪资和测试的薪资,距离没有那么大了。(经过这么多年的发展,开发的薪资已经很理性了。)
人工智能已经起来了,高薪机会很多。(难道是下一个风口,希望不是泡沫)
以上是个人愚见,如有不准,请找招聘网站。我顶多就放了个
阅读全文
0 0
- 从招聘网站爬取职位信息小窥IT发展
- 从招聘网站爬取职位信息小窥IT发展
- Python爬取网站职位信息
- 用Python爬取拉钩网招聘职位信息
- 爬取招聘职位一
- 爬虫:用Python爬取招聘职位信息&职位需求分析
- IT行业招聘职位
- scrapy爬虫实战(二)-------------爬取IT招聘信息
- 爬取招聘信息
- 从招聘网站分析大数据相关职位现状
- webmagic爬取职位信息,新手上路
- 爬取51job的职位信息
- 用Python从智联招聘自动爬取招聘信息
- Scrapy框架爬取腾讯招聘所有职位
- python3小项目——爬取招聘信息(智联招聘)
- java爬取智联招聘职位信息
- 初级数据分析之powershell智联招聘网站统计_北上广招聘职位信息
- 博士职位信息网站
- So Easy! HDU
- 【JZOJ5284】 超级翻转
- chatterbot中get_response函数初步分析。
- arm neon 函数详解
- Java+Selenium3框架设计篇6-如何解决多条类下用例执行只启动一次浏览器的问题
- 从招聘网站爬取职位信息小窥IT发展
- 阿里云esc云服务器IP不能访问的解决办法
- 15. 3Sum
- yii2项目实战-了解一下基于角色的访问控制
- AAA Java中使用akka
- maven之jdk升级配置和jar包升级配置
- 计算机网络(二) --- 网络基础 : 传输方式的分类及网络的构成要素
- Python中最基础类的属性和信息
- Multiple adb connections over WiFi
原创粉丝点击
热门IT博客
热门问题
老师的惩罚
人脸识别
我在镇武司摸鱼那些年
重生之率土为王
我在大康的咸鱼生活
盘龙之生命进化
天生仙种
凡人之先天五行
春回大明朝
姑娘不必设防,我是瞎子
开修车店没生意怎么办
宝宝误喝洗发乳怎么办
支付宝倒闭了钱怎么办
空调加氟加多了怎么办?
银行多付储户钱怎么办
包小工程没经验怎么办
苹果7掉电特别快怎么办
苹果6手机用电快怎么办
徽商银行白金卡怎么办
微商贷款被骗了怎么办
老鼠咬过的肥皂怎么办
老鼠碰过的东西怎么办
想放屁放不出来怎么办
雷蛇键盘进水了怎么办
房间有蛐蛐好吵怎么办
蝙蝠跑家里来了,怎么办
手被老鼠咬了怎么办
家窗户外有蜂窝怎么办
老鼠咬东西很吵怎么办
老鼠躲在空调里怎么办
睡觉被老鼠咬了怎么办
仓鼠吃了浴沙怎么办
仓鼠上手时啃我怎么办
被银狐仓鼠咬了怎么办
被仓鼠咬没出血怎么办
手被仓鼠咬出血怎么办
仓鼠咬了肿了怎么办
被自家仓鼠咬了怎么办
仓鼠生完宝宝后怎么办
被金丝熊咬了怎么办
a字裙子没有内衬怎么办
踩过蟑螂的鞋子怎么办
宝宝给蚂蚁咬了怎么办
脚被蚂蚁咬肿了怎么办
孩子被蚂蚁咬了怎么办
家住高层有老鼠怎么办
久看手机眼睛疼怎么办
晚睡眼睛疼了怎么办
眼睛肿了有点痛怎么办
眼角两边长痘痘怎么办
坐动车行李超重怎么办