kaggle新赛:写作质量预测大赛【数据挖掘】

**赛题名称:**Linking Writing Processes to Writing Quality

**赛题链接:**https://www.kaggle.com/competitions/linking-writing-processes-to-writing-quality

赛题背景

写作过程中存在复杂的行为动作和认知活动,不同作者可能采用不同的计划修订技术、展示不同的停顿模式或在全过程中策略性地分配时间,这些都可能影响写作质量。过去的研究探索了与停顿、添加删除和修订等行为相关的多种过程特征,但是使用的数据集较小,且只研究了少数特征。

本次竞赛使用键盘日志的数据过程特征来预测总体写作质量,可能识别学习者写作行为与表现之间的关系。鉴于当前写作评估工具主要关注最终产出,这可能帮助学习者关注文本产出过程,增强写作的自主性、元认知意识和自我调节。

赛题任务

本次竞赛的目标是预测写作整体质量。写作方式是否会影响作文结果?参赛者将在一个大规模键盘日志数据集上训练模型,该数据集捕获了书写过程特征。

参赛者的工作将帮助探索学习者的书写行为与书写表现之间的关系,这可能为书写指导、自动书写评估技术和智能辅导系统的发展提供有价值的见解。

评价指标

我们使用均方根误差来评分提交项,定义为:

其中是预测值,是n个实例中每个实例i的原始值。

提交文件

对测试集中的每个id,你必须预测对应的score(参见数据页面的描述)。文件应包含一个表头,格式如下:

复制代码
id,score
0000aaaa,1.0
2222bbbb,2.0
4444cccc,3.0
...

数据描述

竞赛数据集包含了大约5000份用户输入日志,如键盘和鼠标点击,这些都是在作文过程中捕获的。每篇作文的评分在0到6的范围内。参赛者的目标是根据用户输入日志来预测一篇作文的评分。

文件和字段信息:

  • train_logs.csv - 用于训练的数据输入日志。

    • id - 文章的唯一ID

    • event_id - 事件的索引,按时间顺序排列

    • down_time - 键盘/鼠标按下的时间,毫秒

    • up_time - 键盘/鼠标释放的时间,毫秒

    • action_time - 事件持续时间(down_time和up_time之差)

  • activity - 事件所属的活动类别

    • Nonproduction - 事件不会改变文本

    • Input - 事件向文档添加文本

    • Remove/Cut - 事件从文档中删除文本

    • Paste - 事件通过粘贴输入改变文本

    • Replace - 事件用另一个字符串替换一段文本

  • Move From [x1, y1] To [x2, y2] - 事件将文本从字符索引x1,y1移动到新的位置x2,y2

  • down_event - 键盘/鼠标按下时的事件名称

  • up_event - 键盘/鼠标释放时的事件名称

  • text_change - 事件导致的文本更改(如果有)

  • cursor_position - 事件后文本光标的字符索引

  • word_count - 事件后文档的词数

注意测试集中可能存在训练集中没有出现过的事件。

  • test_logs.csv - 用于测试的数据输入日志。

  • train_scores.csv

    • id - 文章的唯一ID

    • score - 文章的分数(满分6分,预测目标)

  • sample_submission.csv - 正确格式的提交文件示例。

时间安排

  • 2023 年 10 月 2 日 - 开始日期

  • 2024 年 1 月 2 日 - 报名截止日期

  • 2024 年 1 月 2 日 - 合并截止日期

  • 2024 年 1 月 9 日 - 提交截止日期

赛题奖金

排行榜

  • 第一名 - 12,000美元

  • 第二名 - 8,000美元

  • 第三名 - 5,000美元

效率奖

  • 第一名 - 15,000美元

  • 第二名 - 10,000美元

  • 第三名 - 5,000美元

**关注下方【学姐带你玩AI】**🚀🚀🚀

回复"比赛"获取190+场比赛top方案(kaggle、天池、ccf...)

码字不易,欢迎大家点赞评论收藏!

相关推荐
水如烟6 小时前
孤能子视角:“组织行为学–组织文化“
人工智能
大山同学6 小时前
图片补全-Context Encoder
人工智能·机器学习·计算机视觉
薛定谔的猫19826 小时前
十七、用 GPT2 中文对联模型实现经典上联自动对下联:
人工智能·深度学习·gpt2·大模型 训练 调优
壮Sir不壮7 小时前
2026年奇点:Clawdbot引爆个人AI代理
人工智能·ai·大模型·claude·clawdbot·moltbot·openclaw
PaperRed ai写作降重助手7 小时前
高性价比 AI 论文写作软件推荐:2026 年预算友好型
人工智能·aigc·论文·写作·ai写作·智能降重
玉梅小洋7 小时前
Claude Code 从入门到精通(七):Sub Agent 与 Skill 终极PK
人工智能·ai·大模型·ai编程·claude·ai工具
-嘟囔着拯救世界-7 小时前
【保姆级教程】Win11 下从零部署 Claude Code:本地环境配置 + VSCode 可视化界面全流程指南
人工智能·vscode·ai·编辑器·html5·ai编程·claude code
正见TrueView7 小时前
程一笑的价值选择:AI金玉其外,“收割”老人败絮其中
人工智能
Imm7777 小时前
中国知名的车膜品牌推荐几家
人工智能·python
风静如云7 小时前
Claude Code:进入dash模式
人工智能