一、任务描述:

    了解各岗位在招聘市场的薪资情况

    • 对于招聘方,是合理设置岗位薪酬体系的参考;

    • 对于应聘者,是合理了解市场薪资行情的参考。

    二、任务解析:

    获取招聘网站上企业方各职位给予的薪资空间 ———> 将薪资数据写入Excel,形成岗位薪资分布图。

    三、自动化流程搭建:**

    1、双击打开WinRobot软件后,点击【新建应用】;

    2、点击【数据抓取】**
    image.png

    3、启动数据抓取器后,在浏览器内打开目标采集页,如下图目标采集Java工程师的薪资:image.png

    4、点击【抓取网页元素】

    image.png

    鼠标移入网页抓取所需内容**

    image.png

    点击抓取相似元素

    image.png

    image.png

    5、自动生成一组相似的数据
    如下表,已采集一组薪资,可根据需求新增一列数据。

    image.png

    6、抓取多页数据设置
    **
    勾选【抓取多页】,去【元素库】选择【下一页】按钮”,在【抓取页数】输入要抓取的页数。

    系统会在抓取完一页后,自动点击设定好的【下一页】按钮,继续进行抓取,直到设定的抓取页数完成为

    止,抓取的数据存储于列表web_data_table中。

    爬取招聘网站上用人单位的薪资结构 - 图8

    • 下一页按钮:捕获“下一页”按钮
    • 爬取页数:根据需求填写爬取页数

    7、提取并处理工资数据
    插入Python代码段,将提取到的文本信息进行处理,如从“12-24K”中提取工资的上限(12)和下限(24),并计算平均值(18)。
    还可以对数据继续进行处理,获得工资在不同区间内的分布比例。

    8、写入Excel并绘图
    将抓取结果和数据处理结果写入到Excel中去并绘图。

    四、成果展示:
    本案例中,我们通过非常简易的流程,用了不足20条指令,就实现了在boss直聘网站上,抓取一组杭州地区java工程师(工作年限1~3年,学历:专科,企业规模20~99)薪资数据的任务,并根据抓取结果分析了薪资的区间分布情况。
    部分数据如下:
    image.png

    image.png

    image.png

    最低工资的平均值(考虑标准偏差):8.5±1.4k/月。**