项目源码&数据源获取
项目背景:
1.为企业招聘决策提供科学的依据和参考,可以帮助人力资源部门、招聘机构和求职者了解当前的就业形势、行业趋势和人才需求,从而做出更明智的招聘和求职决策。
2.分析了不同岗位的薪资,学历要求,不同区域、行业对相关人才的需求情况等
数据来源:
和鲸社区:https://www.heywhale.com/mw/project/64cdf0b0e46c020d1a1343d6/dataset
数据清洗(主要包含以下步骤)
1.导入模块与数据
导入下面数据分析和数据可视化要用到的模块。
2.查看、统计缺失值和重复值
查看数据中缺失值有利于及时对不完整的数据进行查看有利于后续的处理。
3.对缺失值进行处理
对缺失值的处理有利于保证数据的完整性。
4.对异常值的检测
对处理后的薪资均值进行异常值检测
5.特征选择和提取
根据业务需求和模型建模目的,选择合适的特征并进行提取,以提高模型的效果。下面根据薪资范围提取和新增薪资上限、薪资下限、薪资均值这三列薪资下限,方便接下来对关于薪资的操作。
6.类别型数据的哑变量处理
对学历要求进行独热编码的作用在于将分类数据转换为计算机模型可以更好理解的格式。独热编码将原始的学历要求这一列数据拆分成多个列,每个列代表一个学历要求的类别,使用 0 或 1 来表示是否满足该要求。并将编码后的数据与原始数据合并。
数据预处理:
数据可视化(成果演示)
1.岗位学历要求可视化分析
2.岗位信息词云图分析
3.岗位平均薪资饼图分析
4.各城市平均薪资与岗位需求柱形图分析
5.北上广深各城市岗位需求柱状图分析
6.薪资均值与工作经验关系箱线图分析
7.项目总结
8.项目论文目录
9.数据处理方法讲解
10.各种可视化图形数据分析及意义