技术栈
模型评估指标
缘友一世
4 小时前
llm
·
nlp
·
模型评估指标
ROUGE和困惑度评估指标学习和体验
ROUGE 也常计算精确率(Precision)和F1值(F1-Score)。📌 重要提示:ROUGE 是一个基于召回率(Recall) 的指标,但在实际应用中,通常会综合查看召回率、精确率和F1值,以便更全面地评估生成文本的质量。
我是有底线的