【62 Pandas+Pyecharts | 智联招聘大数据岗位数据分析可视化】

文章目录

  • [🏳️‍🌈 1. 导入模块](#🏳️‍🌈 1. 导入模块)
  • [🏳️‍🌈 2. Pandas数据处理](#🏳️‍🌈 2. Pandas数据处理)
    • [2.1 读取数据](#2.1 读取数据)
    • [2.2 数据信息](#2.2 数据信息)
    • [2.3 数据去重](#2.3 数据去重)
    • [2.4 薪资处理](#2.4 薪资处理)
  • [🏳️‍🌈 3. Pyecharts数据可视化](#🏳️‍🌈 3. Pyecharts数据可视化)
    • [3.1 各城市平均薪资](#3.1 各城市平均薪资)
    • [3.2 岗位数量前20的城市](#3.2 岗位数量前20的城市)
    • [3.3 岗位学历占比](#3.3 岗位学历占比)
    • [3.4 不同学历平均薪资](#3.4 不同学历平均薪资)
    • [3.5 岗位工作经验占比](#3.5 岗位工作经验占比)
    • [3.6 不同工作经验平均薪资](#3.6 不同工作经验平均薪资)
    • [3.7 不同行业平均薪资](#3.7 不同行业平均薪资)
    • [3.8 不同企业类型数量](#3.8 不同企业类型数量)
    • [3.9 公司规模占比](#3.9 公司规模占比)
    • [3.10 岗位词云](#3.10 岗位词云)
  • [🏳️‍🌈 4. 可视化项目源码+数据](#🏳️‍🌈 4. 可视化项目源码+数据)

大家好,我是 👉 【Python当打之年(点击跳转)】

本期我们利用Python分析「智联招聘大数据岗位数据集」,看看:各招聘城市平均薪资分布、招聘岗位数量分布、岗位学历要求、岗位经验要求、不同学历不同工作经验平均薪资分布等等,希望对大家有所帮助,如有疑问或者需要改进的地方可以联系小编。

涉及到的库:

  • Pandas--- 数据处理
  • Pyecharts--- 数据可视化

🏳️‍🌈 1. 导入模块

python 复制代码
import pandas as pd
from pyecharts.charts import *
from pyecharts import options as opts
import warnings
warnings.filterwarnings('ignore')

🏳️‍🌈 2. Pandas数据处理

2.1 读取数据

python 复制代码
df = pd.read_excel('datas.xlsx')

2.2 数据信息

python 复制代码
df.info()

2.3 数据去重

python 复制代码
df = df.drop_duplicates()

2.4 薪资处理

python 复制代码
def split_salary(salary, method):
    low_salary_1 = 0.0
    high_salary_1 = 0.0
    salary_t = salary.split('·')[0] 
    if '-' in salary_t: 
        low_salary = salary_t.split('-')[0]
        high_salary = salary_t.split('-')[1] 
    if '万' in salary_t:
        low_salary_1 = float(low_salary) * 10000
        high_salary_1 = float(high_salary.replace('万','')) * 10000                     
    elif '元' in salary_t: 
        low_salary_1 = float(low_salary)
        high_salary_1 = float(high_salary.replace('元',''))
        
    if method == 'low':
        returnint(low_salary_1)
    elif method == 'high':
        returnint(high_salary_1)

🏳️‍🌈 3. Pyecharts数据可视化

3.1 各城市平均薪资

python 复制代码
def get_chart():
    chart = (
        Map(i)
        .add('',
            data_pair=datas,
            maptype='china-cities',
            is_map_symbol_show=False,
        )
        .set_global_opts(
            visualmap_opts=opts.VisualMapOpts(
                pos_left = '3%',
                pos_bottom='20%',
                range_color=range_color
            ),
            legend_opts=opts.LegendOpts(is_show=False),
            title_opts=opts.TitleOpts(
                title="1-各城市平均薪资",
                subtitle=subtitle,
                pos_left='center', pos_top='2%',
                title_textstyle_opts=opts.TextStyleOpts(color='#fff200',font_size=20)
            ),
        )
    )
  • 东部地区平均薪资要明显高于中西部地区,沿海地区平均薪资更高。

3.2 岗位数量前20的城市

python 复制代码
def get_chart():
    chart = (
        Bar()
        .add_xaxis(x_data)
        .add_yaxis('', y_data)
        .set_global_opts( 
            visualmap_opts=opts.VisualMapOpts(range_color=range_color),
            title_opts=opts.TitleOpts(
                title='2-岗位数量前20的城市',
                pos_top='2%',pos_left = 'center',
                title_textstyle_opts=opts.TextStyleOpts(color='#fff200',font_size=20)
            ),
        )
    )
  • 从招聘岗位上看上海、西安、成都、天津、重庆、武汉、北京、长沙、杭州、郑州等城市较其他城市更多。

3.3 岗位学历占比

  • 本科学历要求占比最高,占比高达67%,其次是大专类约19%,硕士类约8%。

3.4 不同学历平均薪资

  • 不同学历薪资方面来看,平均薪资和学历关系比较明显,博士平均薪资27K、硕士平均薪资16K、本科平均薪资13K。

3.5 岗位工作经验占比

python 复制代码
def get_chart():
    chart = (
        Pie()
        .add('',
             datas,
             radius=['40%', '70%'],
            )
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title="5-岗位工作经验占比",
                pos_top='2%',pos_left = 'center',
                title_textstyle_opts=opts.TextStyleOpts(color='#fff200',font_size=20)
            ),
            visualmap_opts=opts.VisualMapOpts(
                is_show=False,
                range_color=range_color
            ),
        )
    )
  • 3-5年工作经验需求数量最多,占比约30%,其次是1-3年占比约25%,不限工作经验的岗位数量约占24%,和1-3年占比相当,5-10年工作经验的岗位也达到了15%。

3.6 不同工作经验平均薪资

  • 不同工作经验平均薪资来看,工作经验和平均薪资基本呈正相关的关系,10年工作经验平均薪资30K,5-10年工作经验19K,3-5年工作经验13K。

3.7 不同行业平均薪资

  • 从招聘行业薪资上看:汽车后市场、专用设备制造、新闻/出版、在线医疗、建材、人力资源服务、基金、船舶/航空/航天/火车制造、装饰装修、橡胶和塑料制品等行业的平均薪资相对较高。

3.8 不同企业类型数量

3.9 公司规模占比

3.10 岗位词云

python 复制代码
def get_chart():
    chart = (
        WordCloud()
        .add('',words,word_size_range=[20,50])
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title='10-岗位词云',
                pos_top='2%', pos_left="center",
                title_textstyle_opts=opts.TextStyleOpts(color='#fff200',font_size=20)
            ),
            visualmap_opts=opts.VisualMapOpts(
                is_show=False,
                range_color=range_color
            )
        )
    )

🏳️‍🌈 4. 可视化项目源码+数据

点击跳转:【全部可视化项目源码+数据】


以上就是本期为大家整理的全部内容了,赶快练习起来吧,原创不易,喜欢的朋友可以点赞、收藏 也可以分享注明出处)让更多人知道。

相关推荐
运维行者_1 分钟前
OpManager MSP NetFlow Analyzer集成解决方案,应对多客户端网络流量监控挑战
大数据·运维·服务器·网络·数据库·自动化·运维开发
SiYuanFeng31 分钟前
Colab复现 NanoChat:从 Tokenizer(CPU)、Base Train(CPU) 到 SFT(GPU) 的完整踩坑实录
python·colab
炸炸鱼.1 小时前
Python 操作 MySQL 数据库
android·数据库·python·adb
_深海凉_2 小时前
LeetCode热题100-颜色分类
python·算法·leetcode
AC赳赳老秦2 小时前
OpenClaw email技能:批量发送邮件、自动回复,高效处理工作邮件
运维·人工智能·python·django·自动化·deepseek·openclaw
zhaoshuzhaoshu3 小时前
Python 语法之数据结构详细解析
python
AI问答工程师3 小时前
Meta Muse Spark 的"思维压缩"到底是什么?我用 Python 复现了核心思路(附代码)
人工智能·python
zfan5204 小时前
python对Excel数据处理(1)
python·excel·pandas
小饕4 小时前
我从零搭建 RAG 学到的 10 件事
python
老歌老听老掉牙4 小时前
PyQt5+Qt Designer实战:可视化设计智能参数配置界面,告别手动布局时代!
python·qt