大语言模型-教育方向数据集

大语言模型-教育方向数据集

编号 论文 数据集
1 Bitew S K, Hadifar A, Sterckx L, et al. Learning to Reuse Distractors to Support Multiple-Choice Question Generation in Education[J]. IEEE Transactions on Learning Technologies, 2022, 17: 375-390. Televic, NL, https://github.com/semerekiros/dist-retrieval/tree/main/test-MCQs
2 QASC 问答数据集13小学科学选择题,每个问题包含8个选项,一个正确答案 数据集介绍 QASC 是一个问答数据集。它包含 9,980 道关于小学科学的 8 项选择题(8,134 道题,926 道题,920 道题),并带有 1700 万个句子的语料库,数据集文件格式为jsonl。 https://aistudio.baidu.com/datasetdetail/105820
3 Cobbe K, Kosaraju V, Bavarian M, et al. Training verifiers to solve math word problems[J]. arXiv preprint arXiv:2110.14168, 2021. GSM8K, EN, https://github.com/openai/grade-school-math
4 Hendrycks D, Burns C, Kadavath S, et al. Measuring mathematical problem solving with the math dataset[J]. arXiv preprint arXiv:2103.03874, 2021. https://github.com/Khan/khan-exercises/, https://github.com/hendrycks/apps
5 Huang D, Shi S, Lin C Y, et al. How well do computers solve math word problems? large-scale dataset construction and evaluation[C]//Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). 2016: 887-896. Dolphin18K, https://www.microsoft.com/en-us/research/uploads/prod/2015/08/dolphin18k-v1.1.zip
6


https://arxiv.org/pdf/2403.18105v2

相关推荐
Rorsion4 分钟前
CNN经典神经网络架构
人工智能·深度学习·cnn
KG_LLM图谱增强大模型6 分钟前
MedXIAOHE:医学多模态大模型的完整解决方案,字节跳动小荷医学推出
人工智能
天一生水water7 分钟前
科研龙虾 Research-Claw 使用教程
人工智能
熊猫钓鱼>_>27 分钟前
WorkBuddy使用心得:腾讯版“免部署小龙虾“的办公新体验
人工智能·ai·腾讯云·agent·wechat·openclaw·workbuddy
KG_LLM图谱增强大模型29 分钟前
MedHELM:真实临床医疗任务大语言模型的整体评估框架
人工智能·语言模型·自然语言处理
海涛从不浪30 分钟前
Claude Code+MiniMax安装配置(新手小白向)
人工智能
Neptune132 分钟前
大模型入门:从 TOKEN 到 Agent,搞懂 AI 的底层逻辑(上)
人工智能·深度学习
scott19851232 分钟前
扩散模型之(十六)像素空间生成模型
人工智能·深度学习·计算机视觉·生成式
拖拖76532 分钟前
深度学习架构的进化:ResNet-v2 与预激活的力量
人工智能
蔚天灿雨36 分钟前
Kage:在 Codex、Claude 和 QoderCLI 等 CodingAgentCLI 之间 Fork 与迁移 Session
人工智能·ai·agent·ai编程