大语言模型-教育方向数据集

大语言模型-教育方向数据集

编号 论文 数据集
1 Bitew S K, Hadifar A, Sterckx L, et al. Learning to Reuse Distractors to Support Multiple-Choice Question Generation in Education[J]. IEEE Transactions on Learning Technologies, 2022, 17: 375-390. Televic, NL, https://github.com/semerekiros/dist-retrieval/tree/main/test-MCQs
2 QASC 问答数据集13小学科学选择题,每个问题包含8个选项,一个正确答案 数据集介绍 QASC 是一个问答数据集。它包含 9,980 道关于小学科学的 8 项选择题(8,134 道题,926 道题,920 道题),并带有 1700 万个句子的语料库,数据集文件格式为jsonl。 https://aistudio.baidu.com/datasetdetail/105820
3 Cobbe K, Kosaraju V, Bavarian M, et al. Training verifiers to solve math word problems[J]. arXiv preprint arXiv:2110.14168, 2021. GSM8K, EN, https://github.com/openai/grade-school-math
4 Hendrycks D, Burns C, Kadavath S, et al. Measuring mathematical problem solving with the math dataset[J]. arXiv preprint arXiv:2103.03874, 2021. https://github.com/Khan/khan-exercises/, https://github.com/hendrycks/apps
5 Huang D, Shi S, Lin C Y, et al. How well do computers solve math word problems? large-scale dataset construction and evaluation[C]//Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). 2016: 887-896. Dolphin18K, https://www.microsoft.com/en-us/research/uploads/prod/2015/08/dolphin18k-v1.1.zip
6


https://arxiv.org/pdf/2403.18105v2

相关推荐
AI360labs_atyun4 分钟前
上海打出“开源”国际牌!2025重磅新政
人工智能·科技·学习·ai·开源
沛沛老爹4 分钟前
Java泛型擦除:原理、实践与应对策略
java·开发语言·人工智能·企业开发·发展趋势·技术原理
Deepoch5 分钟前
Deepoc具身模型:破解居家机器人“需求理解”难题
大数据·人工智能·机器人·具身模型·deepoc
AiTop10018 分钟前
英伟达Rubin芯片提前量产,物理AI“ChatGPT 时刻” 降临
人工智能·chatgpt
阿正的梦工坊29 分钟前
Git Rebase 是什么?为什么需要它?
人工智能·git
檐下翻书17332 分钟前
法律文书自动生成与逻辑校验
人工智能
de之梦-御风42 分钟前
【深度学习】模型从训练完成到产线运行的完整使用方式
人工智能·深度学习
Java后端的Ai之路1 小时前
【人工智能领域】-YOLO目标检测算法全解析(含大白话解释)
人工智能·yolo·目标检测·cnn
百家方案1 小时前
“十五五”智慧城市解决方案:从技术赋能到场景智治,再造城市生命共同体
人工智能·智慧城市
_codemonster1 小时前
深度学习实战(基于pytroch)系列完整目录
人工智能·深度学习