【评估与测试】数据集合集，宝藏合集！

本文将为您介绍经典、热门的数据集，希望对您在选择适合的数据集时有所帮助。

NumGLUE

ARB

发布方：

苏黎世联邦理工学院·佐治亚理工学院·DuckAI
发布时间：

2023-07-01
简介：

ARB 是一个新颖的基准数据集，由高级推理问题组成，旨在评估法学硕士在文本理解和专家领域推理方面的能力，提供比以前的基准更具挑战性的测试，其特点是测试更深入的数学、物理、生物、化学和法律知识。
下载地址：

https://github.com/TheDuckAI/arb
论文地址：

https://arxiv.org/pdf/2307.13692.pdf

UniMER Dataset

FeedbackQA

发布方：

加州大学·麦吉尔大学
发布时间：

2022
简介：

我们收集了一个基于检索的 QA 数据集，FeedbackQA，其中包含来自用户的交互式反馈。我们通过将基础 QA 系统部署给众包工作者来收集此数据集，然后众包工作者参与该系统并就其答案的质量提供反馈。反馈包含结构化评级和非结构化自然语言解释。检查底部的数据集浏览器以获取一些真实示例。
下载地址：

https://mcgill-nlp.github.io/feedbackqa/
论文地址：

https://arxiv.org/pdf/2204.03025.pdf

DRAW-1k

发布方：

伊利诺伊大学厄巴纳香槟分校·Microsoft Research
发布时间：

2016-09-21
简介：

DRAW-1K是一个由 1000 个代数应用题组成的数据集，半自动注释用于评估自动求解器。 DRAW 包括黄金系数对齐，这是唯一标识方程系统的推导所必需的。

作者提出了一种针对代数问题自动求解器的新评估方法，它可以识别现有评估方法忽略的错误。他们的建议是使用推导来评估此类求解器，推导反映了如何从文字问题构建方程系统。为了实现这一目标，他们开发了一种算法来检查两个推导之间的等价性，并展示了如何将推导注释半自动添加到现有数据集中。为了使实验更加全面，我们添加了 DRAW-1K 的推导注释，这是一个包含 1000 个一般代数应用题的新数据集。在实验中，他们发现带注释的推导可以比以前使用的指标更准确地评估自动求解器。他们发布了 2300 多个代数应用题的推导注释，以供未来评估。
下载地址：

https://www.microsoft.com/en-us/download/details.aspx?id=52628
论文地址：

https://arxiv.org/pdf/1609.07197

SingleOP（Quantities）

ChemBench4K

SingleEQ

发布方：

华盛顿大学·Allen Institute for AI
发布时间：

2015-12-01
简介：

SINGLEEQ由 508 个问题、1,117 个句子和 15,292 个单词组成。

SingleEQ 数据集位于 questions.json 中，根据需要将其替换为类似格式的数据集。
下载地址：

https://gitlab.cs.washington.edu/ALGES/TACL2015/-/tree/master?ref_type=heads
论文地址：

https://aclanthology.org/Q15-1042.pdf

ProofWriter

发布方：

艾伦人工智能研究所
发布时间：

2020-06-03
简介：

这些数据集伴随着论文"ProofWriter：在自然语言上生成含义、证明和溯因陈述"。它们包含更新的 RuleTaker 风格的数据集，其中包含 50 万个问题、答案和基于自然语言规则库的证明，用于表明 Transformer 可以模拟对用语言表达的规则进行推理，包括证明生成。它包括使用封闭和开放世界语义的变体。证明包括中间结论。额外的注释提供数据来训练迭代的 ProofWriter 模型以及溯因推理来确定不确定的陈述。
下载地址：

https://allenai.org/data/proofwriter
论文地址：

https://arxiv.org/pdf/2012.13048.pdf

DMath (Diverse Math Word Problems)

发布方：

成均馆大学
发布时间：

2023-12-06
简介：

DMath（多元化数学应用题），这是论文" It Ain't Over: A Multi-aspect Diverse Math Word Problem Dataset "的 10K 高质量小学水平数学应用题的集合。
下载地址：

https://github.com/JiwooKimAR/dmath?tab=readme-ov-file
论文地址：

https://aclanthology.org/2023.emnlp-main.927.pdf

温馨小贴士

如有您想了解的计算机方向数据集

请联系我们

免费为您提供数据集搜索服务