NLP基础知识4【CRF】

WHY-2332024-07-28 8:03

目录

基本原理
过程
PS

基本原理

X是输入文本（观测序列）
y是输出标签（状态序列）
特点：
每个状态都可以由整个观测序列决定，与 x 1 , x 2 , . . . . . x n {x_1,x_2,.....x_n} x1,x2,.....xn都相关，实际上一般是上下文10个token就可以了。
对每一个状态y仅与相邻状态 y i − 1 , y i + 1 y_{i-1},y_{i+1} yi−1,yi+1相关
# 公式
通过公式对条件概率进行建模，对于已知概率的观测序列X，求其发生的情况下，各个序列y的发生概率。
t j t_j tj是转移特征函数，主要衡量相邻状态 y之间的影响，同时可以与x相关联
s k s_k sk是状态特征函数，主要衡量观测序列 x对状态变量的影响
λ \lambda λ和 μ \mu μ是对应特征函数的权重
exp用于定义模型中的概率分布函数
Z是规范化因子，用于确保式子是一个概率

过程

CRF模型完全由特征函数和权重决定：

训练阶段（编码）用优化算法迭代，调个包就行
预测阶段（解码）使用维特比算法（动态规划，类似广度优先搜索），寻找概率最高的标签路径
- 使用暴力搜索不可能，使用贪心算法未必是全局最优

PS

转移矩阵 (Transition Matrix)：

这是CRF模型中的一个矩阵，用于表示从一个状态（或标签）转移到另一个状态的概率。对于序列标注任务来说，状态可以是不同的标签（如B（开头）、I（中间）、O（其他）），转移矩阵告诉模型在给定前一个标签后，下一个标签出现的可能性有多大。

发射矩阵 (Emission Matrix)：

发射矩阵用于表示观察到某个状态下特定观察值的概率。在序列标注中，观察值通常是输入的词语或特征，而状态则是对应的标签。发射矩阵告诉模型在给定一个标签时，观察到具体词语的概率。

得分矩阵 (Score Matrix)：

得分矩阵是指CRF模型为每个可能的标签序列分配的分数。这些分数基于转移矩阵和发射矩阵的组合计算得出，通常利用动态规划算法（如维特比算法）来确定最佳的标签序列。

上一篇：2024最新Uniapp的H5网页版添加谷歌授权验证

下一篇：如何解决 uni-app 项目中 “文件查找失败：‘crypto-js‘“ 的问题

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 0300 Debian字符界面如何支持中文 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）05微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 062026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？072026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 08AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 09Agnes AI 免费 API 接入指南：文本、生图、生视频，一套接口全免费 102026 年 AI 大模型 & AI 编程工具实战全总结