【62 Pandas+Pyecharts | 智联招聘大数据岗位数据分析可视化】

文章目录

  • [🏳️‍🌈 1. 导入模块](#🏳️‍🌈 1. 导入模块)
  • [🏳️‍🌈 2. Pandas数据处理](#🏳️‍🌈 2. Pandas数据处理)
    • [2.1 读取数据](#2.1 读取数据)
    • [2.2 数据信息](#2.2 数据信息)
    • [2.3 数据去重](#2.3 数据去重)
    • [2.4 薪资处理](#2.4 薪资处理)
  • [🏳️‍🌈 3. Pyecharts数据可视化](#🏳️‍🌈 3. Pyecharts数据可视化)
    • [3.1 各城市平均薪资](#3.1 各城市平均薪资)
    • [3.2 岗位数量前20的城市](#3.2 岗位数量前20的城市)
    • [3.3 岗位学历占比](#3.3 岗位学历占比)
    • [3.4 不同学历平均薪资](#3.4 不同学历平均薪资)
    • [3.5 岗位工作经验占比](#3.5 岗位工作经验占比)
    • [3.6 不同工作经验平均薪资](#3.6 不同工作经验平均薪资)
    • [3.7 不同行业平均薪资](#3.7 不同行业平均薪资)
    • [3.8 不同企业类型数量](#3.8 不同企业类型数量)
    • [3.9 公司规模占比](#3.9 公司规模占比)
    • [3.10 岗位词云](#3.10 岗位词云)
  • [🏳️‍🌈 4. 可视化项目源码+数据](#🏳️‍🌈 4. 可视化项目源码+数据)

大家好,我是 👉 【Python当打之年(点击跳转)】

本期我们利用Python分析「智联招聘大数据岗位数据集」,看看:各招聘城市平均薪资分布、招聘岗位数量分布、岗位学历要求、岗位经验要求、不同学历不同工作经验平均薪资分布等等,希望对大家有所帮助,如有疑问或者需要改进的地方可以联系小编。

涉及到的库:

  • Pandas--- 数据处理
  • Pyecharts--- 数据可视化

🏳️‍🌈 1. 导入模块

python 复制代码
import pandas as pd
from pyecharts.charts import *
from pyecharts import options as opts
import warnings
warnings.filterwarnings('ignore')

🏳️‍🌈 2. Pandas数据处理

2.1 读取数据

python 复制代码
df = pd.read_excel('datas.xlsx')

2.2 数据信息

python 复制代码
df.info()

2.3 数据去重

python 复制代码
df = df.drop_duplicates()

2.4 薪资处理

python 复制代码
def split_salary(salary, method):
    low_salary_1 = 0.0
    high_salary_1 = 0.0
    salary_t = salary.split('·')[0] 
    if '-' in salary_t: 
        low_salary = salary_t.split('-')[0]
        high_salary = salary_t.split('-')[1] 
    if '万' in salary_t:
        low_salary_1 = float(low_salary) * 10000
        high_salary_1 = float(high_salary.replace('万','')) * 10000                     
    elif '元' in salary_t: 
        low_salary_1 = float(low_salary)
        high_salary_1 = float(high_salary.replace('元',''))
        
    if method == 'low':
        returnint(low_salary_1)
    elif method == 'high':
        returnint(high_salary_1)

🏳️‍🌈 3. Pyecharts数据可视化

3.1 各城市平均薪资

python 复制代码
def get_chart():
    chart = (
        Map(i)
        .add('',
            data_pair=datas,
            maptype='china-cities',
            is_map_symbol_show=False,
        )
        .set_global_opts(
            visualmap_opts=opts.VisualMapOpts(
                pos_left = '3%',
                pos_bottom='20%',
                range_color=range_color
            ),
            legend_opts=opts.LegendOpts(is_show=False),
            title_opts=opts.TitleOpts(
                title="1-各城市平均薪资",
                subtitle=subtitle,
                pos_left='center', pos_top='2%',
                title_textstyle_opts=opts.TextStyleOpts(color='#fff200',font_size=20)
            ),
        )
    )
  • 东部地区平均薪资要明显高于中西部地区,沿海地区平均薪资更高。

3.2 岗位数量前20的城市

python 复制代码
def get_chart():
    chart = (
        Bar()
        .add_xaxis(x_data)
        .add_yaxis('', y_data)
        .set_global_opts( 
            visualmap_opts=opts.VisualMapOpts(range_color=range_color),
            title_opts=opts.TitleOpts(
                title='2-岗位数量前20的城市',
                pos_top='2%',pos_left = 'center',
                title_textstyle_opts=opts.TextStyleOpts(color='#fff200',font_size=20)
            ),
        )
    )
  • 从招聘岗位上看上海、西安、成都、天津、重庆、武汉、北京、长沙、杭州、郑州等城市较其他城市更多。

3.3 岗位学历占比

  • 本科学历要求占比最高,占比高达67%,其次是大专类约19%,硕士类约8%。

3.4 不同学历平均薪资

  • 不同学历薪资方面来看,平均薪资和学历关系比较明显,博士平均薪资27K、硕士平均薪资16K、本科平均薪资13K。

3.5 岗位工作经验占比

python 复制代码
def get_chart():
    chart = (
        Pie()
        .add('',
             datas,
             radius=['40%', '70%'],
            )
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title="5-岗位工作经验占比",
                pos_top='2%',pos_left = 'center',
                title_textstyle_opts=opts.TextStyleOpts(color='#fff200',font_size=20)
            ),
            visualmap_opts=opts.VisualMapOpts(
                is_show=False,
                range_color=range_color
            ),
        )
    )
  • 3-5年工作经验需求数量最多,占比约30%,其次是1-3年占比约25%,不限工作经验的岗位数量约占24%,和1-3年占比相当,5-10年工作经验的岗位也达到了15%。

3.6 不同工作经验平均薪资

  • 不同工作经验平均薪资来看,工作经验和平均薪资基本呈正相关的关系,10年工作经验平均薪资30K,5-10年工作经验19K,3-5年工作经验13K。

3.7 不同行业平均薪资

  • 从招聘行业薪资上看:汽车后市场、专用设备制造、新闻/出版、在线医疗、建材、人力资源服务、基金、船舶/航空/航天/火车制造、装饰装修、橡胶和塑料制品等行业的平均薪资相对较高。

3.8 不同企业类型数量

3.9 公司规模占比

3.10 岗位词云

python 复制代码
def get_chart():
    chart = (
        WordCloud()
        .add('',words,word_size_range=[20,50])
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title='10-岗位词云',
                pos_top='2%', pos_left="center",
                title_textstyle_opts=opts.TextStyleOpts(color='#fff200',font_size=20)
            ),
            visualmap_opts=opts.VisualMapOpts(
                is_show=False,
                range_color=range_color
            )
        )
    )

🏳️‍🌈 4. 可视化项目源码+数据

点击跳转:【全部可视化项目源码+数据】


以上就是本期为大家整理的全部内容了,赶快练习起来吧,原创不易,喜欢的朋友可以点赞、收藏 也可以分享注明出处)让更多人知道。

相关推荐
棒棒的皮皮10 分钟前
【OpenCV】Python图像处理之仿射变换
图像处理·python·opencv·计算机视觉
又是努力搬砖的一年15 分钟前
elasticsearch修改字段类型
android·大数据·elasticsearch
weixin_4462608518 分钟前
FastF1: 轻松获取和分析F1数据的Python包
开发语言·python
我送炭你添花20 分钟前
Pelco KBD300A 模拟器:06.用 PyQt5 实现 1:1 像素级完美复刻 Pelco KBD300A 键盘
python·qt·自动化·运维开发
山土成旧客22 分钟前
【Python学习打卡-Day22】启航Kaggle:从路径管理到独立项目研究的全方位指南
开发语言·python·学习
我命由我1234523 分钟前
Python Flask 开发 - Flask 路径参数类型(string、int、float、path、uuid)
服务器·开发语言·后端·python·flask·学习方法·python3.11
Chen--Xing37 分钟前
LeetCode LCR 119.最长连续序列
c++·python·算法·leetcode·rust
六行神算API-天璇39 分钟前
数字人“个性化”背后的玄机:大模型微调与RAG实战解析
大数据·人工智能
BoBoZz1940 分钟前
ConnectivityFilter数据集中分离的区域或连通分量
python·vtk·图形渲染·图形处理
程序员杰哥42 分钟前
如何使用Postman做接口自动化测试?
自动化测试·软件测试·python·测试工具·测试用例·接口测试·postman