【2024年第三届中国高校大数据挑战赛】赛题 D:行业职业技术培训能力评价 思路+代码+参考论文

【2024年第三届中国高校大数据挑战赛】赛题 D:行业职业技术培训能力评价 思路+代码+参考论文

加群可以享受定制等更多服务,或者搜索B站:数模洛凌寺

联络组织企鹅:904117571

以下是D题老师的解题思路(企鹅内还会随时更新文档):

2024中国高校大数据挑战赛D题思路详解

1 问题重述

1.一般而言,入学的各技能考核成绩与对应的离校考核成绩绩可能存在着或多或少或无的关联性 。请你对此进行分析。

2.不同的培训学校有不同的生源质量、学校办学条件、学校师资水平等的差异,仅仅用离校考核成绩的高低无法真正有效的体现一个学校的真正的培训能力。
请你运用附件数据,阐明什么类型的培训学校,具体哪些培训学校在培训能力上面有较高的水平?
请给不同类型的培训学校培训能力进行排序,以及给出培训能力前10的学校编号。

3.每个培训学校有不同的特色,如有些培训学校技能1的培训能力很好,而有些学校可能是技能2的培训能力上有优势。
请问,哪些培训学校分别在哪种技能培训能力上有特色?每种技能列出前5名的学校编号。

4.假设行业主管部门计划给10000名学员颁发职业资格证书。
请问,哪些因素对获取职业资格证书有着非常重要的影响?
数据表中最后有 10名学员的离校考核成绩被删除,请你判断他们能否获取职业资格证?

如果职业资格证分为一级和二级(一、二级比例为1:3),那这10名学员中谁能获取一级职业资格证书?

2 问题分析

视频讲解如下:视频讲解

2.0 数据预处理

在做所有问题之前,需要对数据进行预处理和描述性统计

2.1 问题一分析

相关性分析、例如皮尔逊相关系数等

2.2 问题二分析

需要分组讨论,不同类型的学校可以看成我们大学里不同的专业,可能难度不同,评分标准就不同

一共6种类型的学校,需要分组讨论

培训能力如何定义,需要借助文献,或者自己制定一个评分标准

2.3 问题三分析

在上一问的基础上,对每个类型学校(例如每个专业)的5个技能(科目)进行分析

这一问是上一问的延伸,上一问讨论的是类型,这一问讨论的是技能(科目)

2.4 问题四分析

可以建立一个回归模型,然后分析所构建的特征(X)对y(我们自己定义的评分)的影响

建立回归模型,给出最终32165名学生的综合评分,然后进行排序。

删除离校成绩的10名学生,建模的时候,只能考虑其入学成绩以及衍生特征

更多思路

bash 复制代码
i = 1
if i == 1 :
    print('904117571')
相关推荐
努力的小雨4 天前
我用 QClaw 做了个 Web3 陪学助手,专治 Java 程序员的“概念劝退”
经验分享·ai智能
SM1771521183816 天前
NSK紧凑型FA系列丝杠技术详解
经验分享·规格说明书
fofantasy16 天前
NSK SFT3210-2.5 滚珠丝杠技术详解
经验分享·规格说明书
BomanGe1016 天前
NSK USS1205N1D0321 紧凑型精密滚珠丝杠技术详解
经验分享·规格说明书
阿米亚波16 天前
【Windows】QEMU 启动 openEuler aarch64/arm64 架构系统 + 离线软件源
linux·windows·经验分享·笔记·架构·arm
AIHR数智引擎16 天前
KPI物理失效:AI原生组织的效能重构与技能度量
人工智能·经验分享·职场和发展·重构·ai-native·aihr
兜里只有三分钱~16 天前
快递索赔场景评测|魔珐星云职场法务数字人线下落地实测
数学建模·数字人·数字
一切皆是因缘际会16 天前
RLHF奖励坍塌:大模型Reward漂移机理
人工智能·数学建模·ai
BomanLj16 天前
NSK DFT1604-2.5 滚珠丝杠技术详解
经验分享·规格说明书
中屹指纹浏览器16 天前
2026指纹浏览器字体指纹、字体渲染偏差检测与全维度虚拟字体池搭建方案
经验分享·笔记