【55 Pandas+Pyecharts | 实习僧网Python岗位招聘数据分析可视化】

文章目录

  • [🏳️‍🌈 1. 导入模块](#🏳️‍🌈 1. 导入模块)
  • [🏳️‍🌈 2. Pandas数据处理](#🏳️‍🌈 2. Pandas数据处理)
    • [2.1 读取数据](#2.1 读取数据)
    • [2.2 查看数据信息](#2.2 查看数据信息)
    • [2.3 去除重复数据](#2.3 去除重复数据)
    • [2.4 调整部分城市名称](#2.4 调整部分城市名称)
  • [🏳️‍🌈 3. Pyecharts数据可视化](#🏳️‍🌈 3. Pyecharts数据可视化)
    • [3.1 招聘数量前20岗位](#3.1 招聘数量前20岗位)
    • [3.2 各城市招聘数量](#3.2 各城市招聘数量)
    • [3.3 各城市平均薪资象形图](#3.3 各城市平均薪资象形图)
    • [3.4 招聘学历占比](#3.4 招聘学历占比)
    • [3.5 实习薪资分布](#3.5 实习薪资分布)
    • [3.6 实习薪资区间](#3.6 实习薪资区间)
    • [3.7 实习时间要求](#3.7 实习时间要求)
    • [3.8 实习工作周期](#3.8 实习工作周期)
    • [3.9 公司词云](#3.9 公司词云)
  • [🏳️‍🌈 4. 可视化大屏](#🏳️‍🌈 4. 可视化大屏)
    • [4.1 普通大屏](#4.1 普通大屏)
    • [4.2 Flask大屏](#4.2 Flask大屏)
  • [🏳️‍🌈 5. 可视化项目源码+数据](#🏳️‍🌈 5. 可视化项目源码+数据)

大家好,我是 👉 【Python当打之年(点击跳转)】

本期将利用Python分析「实习僧网站招聘数据」 ,看看:各城市python岗位实习生招聘数量,招聘平均薪资分布,招聘岗位分布,招聘学历要求、实习周期分布等情况,希望对大家有所帮助,如有疑问或者需要改进的地方可以联系小编。

【下期:实习僧网站岗位数据爬虫】

涉及到的库:

  • Pandas --- 数据处理
  • Pyecharts --- 数据可视化

🏳️‍🌈 1. 导入模块

python 复制代码
import pandas as pd
from pyecharts.charts import *
from pyecharts.commons.utils import JsCode
from pyecharts import options as opts
import warnings
warnings.filterwarnings('ignore')

🏳️‍🌈 2. Pandas数据处理

2.1 读取数据

python 复制代码
df = pd.read_excel('./实习僧招聘数据.xlsx')

2.2 查看数据信息

python 复制代码
df.info()
  • 一共有600条数据,包含岗位名称、公司、城市、学历、福利、薪资、工作周期、实习时间等字段

2.3 去除重复数据

python 复制代码
df1 = df.drop_duplicates()

2.4 调整部分城市名称

python 复制代码
df['城市'] = df['城市'].replace({'上海市':'上海','成都市':'成都','武汉市':'武汉','北京市':'北京','深圳市':'深圳'})

🏳️‍🌈 3. Pyecharts数据可视化

3.1 招聘数量前20岗位

python 复制代码
def get_bar1():
    chart = (
        Bar()
        .add_xaxis(x_data)
        .add_yaxis('', y_data,label_opts=opts.LabelOpts(position='right'))
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title="1-招聘数量前20岗位",
                pos_left="center",
                pos_top='2%',
                subtitle=subtitle,
            ),
            visualmap_opts=opts.VisualMapOpts(
                is_show=True,
            ),
        )     )
  • 招聘数量前20的岗位主要是:后端开发、算法、软件开发、后端开发工程师、深度学习算法、NLP算法、后端、算法工程师、机器学习、视觉算法、python开发、后端研发、软件工程师、软件开发工程师、语音算法、NLP、Python开发、AI算法、大模型算法、图像算法等,主要以后端算法为主。

3.2 各城市招聘数量

  • 招聘地点主要集中在:北京、上海、深圳、杭州、成都、南京、广州、苏州、武汉等城市。

3.3 各城市平均薪资象形图

python 复制代码
def get_pictorialBar():
    chart = (
        PictorialBar()
        .add_xaxis(x_data)
        .add_yaxis(
            "",
            y_data,
            label_opts=opts.LabelOpts(is_show=False),
            symbol_size=12,
            symbol_repeat="fixed",
            symbol_offset=[0, 0],
            is_symbol_clip=True,
        )
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title='3-各城市平均薪资象形图',
                pos_left="center",
                pos_top='2%',
                subtitle=subtitle,
            ),
            xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=90)),
            visualmap_opts=opts.VisualMapOpts(
                is_show=True,
            ),
        )
    )
  • 上海、北京、深圳、杭州等地的平均薪资相较于其他城市更高一些。

3.4 招聘学历占比

  • 招聘学历方面主要以本科、硕士为主,占比超过80%。

3.5 实习薪资分布

python 复制代码
def get_scatter():
    chart = (
        Scatter()
        .add_xaxis(x_data)
        .add_yaxis(
            "",
            y_data,
            label_opts=opts.LabelOpts(is_show=False),
        )
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title="5-实习薪资分布",
                pos_left="center",
                pos_top='2%',
                subtitle=subtitle,
            ),
            xaxis_opts=opts.AxisOpts(name='id'),
            yaxis_opts=opts.AxisOpts(name='元/天'),
            visualmap_opts=opts.VisualMapOpts(
                is_show=True,
            ),
        )     )
  • 实习期间薪资基本上集中在100-400元/天这个区间。

3.6 实习薪资区间

3.7 实习时间要求

  • 实习时间上大部分公司要求实习3-6个月,以3个月居多,也存在实习期1个月和1年的情况。

3.8 实习工作周期

python 复制代码
def get_scatter():
    chart = (
        Pie()
        .add("",
             [list(z) for z in zip(x_data, y_data)],
             center=['50%','55%'],
            )
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title="8-实习工作周期",
                pos_left="center",
                pos_top='2%',
                subtitle=subtitle,
            ),
            visualmap_opts=opts.VisualMapOpts(
                is_show=True,
            ),
        )     
        )
  • 实习工作周期以5天/周为主,占比接近65%。

3.9 公司词云

python 复制代码
def get_WordCloud():
    chart = (
        WordCloud(init_opts=init_opts)
        .add('',words,word_size_range=[5,34])
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title='9-公司词云',
                subtitle=subtitle,
                pos_top='2%',
                pos_left='center',
            ),
            visualmap_opts=opts.VisualMapOpts(
                is_show=False,
            ),
        )    )

🏳️‍🌈 4. 可视化大屏

4.1 普通大屏

4.2 Flask大屏

🏳️‍🌈 5. 可视化项目源码+数据

点击跳转:【全部可视化项目源码+数据】


以上就是本期为大家整理的全部内容了,赶快练习起来吧,原创不易,喜欢的朋友可以点赞、收藏 也可以分享注明出处)让更多人知道。

相关推荐
shanks6625 分钟前
【PyQt】学习PyQt进行GUI开发从基础到进阶逐步掌握详细路线图和关键知识点
python·pyqt
weixin_307779131 小时前
流媒体娱乐服务平台在AWS上使用Presto作为大数据的交互式查询引擎的具体流程和代码
大数据·python·音视频·aws
職場上的造物主2 小时前
高清种子资源获取指南 | ✈️@seedlinkbot
python·ios·php·音视频·视频编解码·视频
Amd7942 小时前
应用中的 PostgreSQL项目案例
postgresql·数据分析·数据库管理·最佳实践·技术架构·实际应用·项目案例
〖是♂我〗3 小时前
自定义数据集 使用scikit-learn中svm的包实现svm分类
开发语言·python
抱抱宝3 小时前
Pyecharts之特殊图表的独特展示
python·信息可视化·数据分析
deephub4 小时前
Python GIL(全局解释器锁)机制对多线程性能影响的深度分析
python·机器学习·gil
MatpyMaster4 小时前
基于PyQt5打造的实用工具——PDF文件加图片水印,可调大小位置,可批量处理!
python·pdf
go54631584655 小时前
python 从知网的期刊导航页面抓取与农业科技相关的数据
开发语言·python·科技
米码收割机5 小时前
【python】tkinter实现音乐播放器(源码+音频文件)【独一无二】
开发语言·python·pygame