技术栈
自动评估
HuggingFace
1 天前
人工智能
·
自动评估
自动评估基准 | 设计你的自动评估任务
这是 自动评估基准 系列文章的第二篇,敬请关注系列文章:做评估时,你可以选择现有的数据集 (参考 一些评估数据集 页面) 作为测试集,也可以设计自己的数据集。有一点非常重要,请注意:评估的结果与评估的数据集质量高度相关 。
HuggingFace
2 天前
自动评估
自动评估基准 | 基础概念
这是 自动评估基准 系列文章的第一篇,敬请关注系列文章:注:本文内容与我写的 通用评估博客 存在部分重叠