Kneser-Ney平滑(Kneser-Ney smoothing)简介

Chat-GPT 3.5给的答案,先记在这里,后面有机会深入了解再补充。

Kneser-Ney平滑(Kneser-Ney smoothing)是一种用于解决语言模型中零概率问题的平滑技术。它是由Kneser和Ney在1995年提出的,被广泛应用于n-gram语言模型中。

在语言模型中,n-gram是指由n个连续的词组成的序列。n-gram语言模型的目标是计算给定一个上下文的情况下,下一个词的概率。然而,当模型遇到未在训练数据中出现的n-gram时,概率会变为零,这会导致模型在生成或评估文本时出现问题。

Kneser-Ney平滑通过引入一个调整因子来解决零概率问题。它的基本思想是利用n-gram的上下文信息来估计未见n-gram的概率。具体来说,Kneser-Ney平滑使用两个概率值:补充概率(continuation probability)和回退概率(discounted probability)。

  • 补充概率:补充概率表示给定上下文中下一个词的概率。它通过计算给定上下文的n-gram数量和包含该n-gram的不同上下文数量之比来估计。补充概率提供了一个对未见n-gram的概率估计。
  • 回退概率:回退概率表示在给定上下文中下一个词的概率。它通过计算给定上下文的n-1 gram数量和包含该n-1
    gram的不同上下文数量之比来估计。回退概率提供了一个对已见n-gram的概率估计。

Kneser-Ney平滑的计算过程 如下:

(1)统计训练数据中每个n-gram的出现次数和不同上下文的数量。

计算补充概率和回退概率。

(2)在计算概率时,使用补充概率和回退概率来调整未见和已见n-gram的概率。

(3)Kneser-Ney平滑通过利用上下文信息来提高语言模型的性能,尤其是在处理未见n-gram时。它在n-gram语言模型中被广泛使用,并在自然语言处理任务中取得了良好的效果。

相关推荐
故事挺秃然5 小时前
大型语言模型(LLM)架构大比拼
语言模型·nlp
苦瓜汤补钙5 小时前
论文阅读——Segment Anything(Meta AI)——SAM
论文阅读·图像处理·人工智能·nlp·ai编程
合作小小程序员小小店18 小时前
舆情,情感微博系统demo,基于python+qt+nlp,开发语言python,界面库qt,无数据库版,数据来自第三方网站获取,
开发语言·pytorch·qt·自然语言处理·nlp
故事挺秃然1 天前
NLP模型优化
人工智能·自然语言处理·nlp
wangqiaowq2 天前
采用 Trie 树结合 RoaringBitmap 技术,构建高效的子串倒排索引
nlp
合作小小程序员小小店2 天前
web网页,在线%抖音,舆情%分析系统demo,基于python+web+echart+nlp+知识图谱,数据库mysql
数据库·python·自然语言处理·flask·nlp·echarts·知识图谱
缘友一世2 天前
LLama3架构原理浅浅学学
人工智能·自然语言处理·nlp·transformer·llama
合作小小程序员小小店4 天前
大屏开发,在线歌词舆情分析系统demo,基于python,flask,web,echart,nlp,自然语言数据库mysql。
后端·python·flask·nlp·echarts
烟袅4 天前
在浏览器中做 NLP?用 JavaScript 实现文本分类的实用探索
javascript·nlp
AI人工智能+5 天前
智能文本抽取:通过OCR、自然语言处理等多项技术,将非结构化文档转化为可读、可分析的数据资产
人工智能·nlp·ocr·文本抽取