NLP | 生成任务指标: BLEU, ROUGE

文章目录

1、BLEU:

BLEU思想(越大越好):比较候选译文和参考译文里的 n-gram 的重合程度,重合程度越高就认为译文质量越高。unigram用于衡量单词翻译的准确性,高阶n-gram用于衡量句子翻译的流畅性。

2、ROUGE:

ROUGE (Recall-Oriented Understudy for Gisting Evaluation)专注于召回率(关注有多少个参考译句中的 n- gram出现在了输出之中)而非精度(候选译文中的n-gram有没有在参考译文中出现过)。

  • rouge-n:基于ngram共现性统计
  • rouge-l:基于最长公共子序列的共现性召回率和精确率的F1计算
  • rough-w:带权重的最长公共子序列的的共现性召回率和精确率的F1计算
  • rouge-s:不连续二元组共现性召回率和精确率的F1计算
  • 一般用:bleu-4, rouge-l, rouge-1, rouge-2

Reference:
https://blog.csdn.net/u012744245/article/details/123589005

相关推荐
bohu8317 分钟前
opencv笔记2
人工智能·笔记·opencv
万事可爱^20 分钟前
算法入门(九)—— 无监督学习介绍与K-Means实战(内附Kaggle实战源码与数据集)
人工智能·学习·算法·机器学习·kmeans
董董灿是个攻城狮27 分钟前
019:什么是 Resnet50 神经网络
人工智能·计算机视觉·cnn
Allen200001 小时前
wow-agent---task2使用llama-index创建Agent
人工智能·llama
BoostingIsm1 小时前
【环境安装】安装LLaMA-Factory
人工智能·深度学习
不去幼儿园2 小时前
【博客之星】2024年度个人成长、强化学习算法领域总结
人工智能·python·算法·机器学习·强化学习·个人总结
程序猿阿伟2 小时前
《AI与鸿蒙Next:建筑设计可视化的革新力量》
人工智能·华为·harmonyos
微学AI3 小时前
GPU算力平台|在GPU算力平台部署虚拟服装试穿工具OOTDiffusion的教程
人工智能·gpu算力·服装试穿
董董灿是个攻城狮4 小时前
020:为什么 Resnet 如此重要?
人工智能·计算机视觉·cnn
汪子熙4 小时前
为什么 BERT 仅使用 Transformer 的编码器部分,而不使用解码器部分?
人工智能