MSciNLI—— 针对科学自然语言推理任务提出的多样化数据集用于训练语言模型和大规模语言模型建立基线论文地址:https://arxiv.org/pdf/2404.08066 源码地址:https://github.com/msadat3/mscinli 自然语言推理(NLI)是一项识别两个句子之间语义关系的任务。第一个句子称为 “前提”,第二个句子称为 “假设”。传统的自然语言推理数据集包括 SNLI、MNLI、SICK 和 ANLI,它们将假设分为三类:暗示、与前提相矛盾或与前提中立。这些数据集不仅被用作自然语言理解(NLU)的基准,还被用于事实检查和假新闻检测等下游任务。它们还促进了表征学习、迁移