Kneser-Ney平滑(Kneser-Ney smoothing)简介

Chat-GPT 3.5给的答案,先记在这里,后面有机会深入了解再补充。

Kneser-Ney平滑(Kneser-Ney smoothing)是一种用于解决语言模型中零概率问题的平滑技术。它是由Kneser和Ney在1995年提出的,被广泛应用于n-gram语言模型中。

在语言模型中,n-gram是指由n个连续的词组成的序列。n-gram语言模型的目标是计算给定一个上下文的情况下,下一个词的概率。然而,当模型遇到未在训练数据中出现的n-gram时,概率会变为零,这会导致模型在生成或评估文本时出现问题。

Kneser-Ney平滑通过引入一个调整因子来解决零概率问题。它的基本思想是利用n-gram的上下文信息来估计未见n-gram的概率。具体来说,Kneser-Ney平滑使用两个概率值:补充概率(continuation probability)和回退概率(discounted probability)。

  • 补充概率:补充概率表示给定上下文中下一个词的概率。它通过计算给定上下文的n-gram数量和包含该n-gram的不同上下文数量之比来估计。补充概率提供了一个对未见n-gram的概率估计。
  • 回退概率:回退概率表示在给定上下文中下一个词的概率。它通过计算给定上下文的n-1 gram数量和包含该n-1
    gram的不同上下文数量之比来估计。回退概率提供了一个对已见n-gram的概率估计。

Kneser-Ney平滑的计算过程 如下:

(1)统计训练数据中每个n-gram的出现次数和不同上下文的数量。

计算补充概率和回退概率。

(2)在计算概率时,使用补充概率和回退概率来调整未见和已见n-gram的概率。

(3)Kneser-Ney平滑通过利用上下文信息来提高语言模型的性能,尤其是在处理未见n-gram时。它在n-gram语言模型中被广泛使用,并在自然语言处理任务中取得了良好的效果。

相关推荐
查无此人byebye2 天前
【超详细解读(GPU)】基于DiT的MNIST扩散模型(DDPM)完整实现
python·深度学习·nlp·transformer·多分类
乌萨奇5372 天前
【2025考研复试】深度学习扩展知识:从ViT到多模态,以及简历项目挖掘策略(第11章复盘)
人工智能·深度学习·考研·计算机视觉·nlp·多模态
查无此人byebye2 天前
基于DiT+DDPM的MNIST数字生成:模型推理实战教程
人工智能·python·深度学习·nlp·transformer
Yaozh、3 天前
【word2vec模型】两种模型结构CBOW和Skip-gram的具体过程
人工智能·深度学习·神经网络·自然语言处理·nlp·word2vec
AI资源库6 天前
解构嵌入模型之王:All-MiniLM-L6-v2 的文件树解密、蒸馏机制与工业级应用生态
langchain·nlp·bert·embedding·hugging face·fine-tuning·ai agent
肾透侧视攻城狮7 天前
《完结篇 | PyTorch Transformer实战:构建你的第一个LSTM情感分析模型(含环境配置、数据、训练、评估全代码)》
深度学习·nlp·transformer·文本情感分析项目·lstm模型架构图·评估函数及准确率计算·预测新文本
shenxianasi8 天前
【论文精读】Learning Transferable Visual Models From Natural Language Supervision
人工智能·深度学习·机器学习·计算机视觉·nlp
墨心@8 天前
沐曦MCX500安装llama factory
人工智能·笔记·语言模型·自然语言处理·chatgpt·nlp·llama
aiguangyuan9 天前
使用LSTM进行情感分类:原理与实现剖析
人工智能·python·nlp
茶栀(*´I`*)9 天前
【NLP入门笔记】:自然语言处理基础与文本预处理
人工智能·自然语言处理·nlp