一、任务描述:
了解各岗位在招聘市场的薪资情况
对于招聘方,是合理设置岗位薪酬体系的参考;
对于应聘者,是合理了解市场薪资行情的参考。
二、任务解析:
获取招聘网站上企业方各职位给予的薪资空间 ———> 将薪资数据写入Excel,形成岗位薪资分布图。
三、自动化流程搭建:**
1、双击打开WinRobot软件后,点击【新建应用】;
2、点击【数据抓取】**
3、启动数据抓取器后,在浏览器内打开目标采集页,如下图目标采集Java工程师的薪资:
4、点击【抓取网页元素】
鼠标移入网页抓取所需内容**
点击抓取相似元素
5、自动生成一组相似的数据
如下表,已采集一组薪资,可根据需求新增一列数据。
6、抓取多页数据设置
**
勾选【抓取多页】,去【元素库】选择【下一页】按钮”,在【抓取页数】输入要抓取的页数。
系统会在抓取完一页后,自动点击设定好的【下一页】按钮,继续进行抓取,直到设定的抓取页数完成为
止,抓取的数据存储于列表web_data_table中。
- 下一页按钮:捕获“下一页”按钮
- 爬取页数:根据需求填写爬取页数
7、提取并处理工资数据
插入Python代码段,将提取到的文本信息进行处理,如从“12-24K”中提取工资的上限(12)和下限(24),并计算平均值(18)。
还可以对数据继续进行处理,获得工资在不同区间内的分布比例。
8、写入Excel并绘图
将抓取结果和数据处理结果写入到Excel中去并绘图。
四、成果展示:
本案例中,我们通过非常简易的流程,用了不足20条指令,就实现了在boss直聘网站上,抓取一组杭州地区java工程师(工作年限1~3年,学历:专科,企业规模20~99)薪资数据的任务,并根据抓取结果分析了薪资的区间分布情况。
部分数据如下:
最低工资的平均值(考虑标准偏差):8.5±1.4k/月。**