NLP基础知识4【CRF】

目录

基本原理

  • X是输入文本(观测序列)
  • y是输出标签(状态序列)
    特点:
  • 每个状态都可以整个 观测序列决定,与 x 1 , x 2 , . . . . . x n {x_1,x_2,.....x_n} x1,x2,.....xn都相关,实际上一般是上下文10个token就可以了。
  • 对每一个状态y仅与相邻状态 y i − 1 , y i + 1 y_{i-1},y_{i+1} yi−1,yi+1相关
    # 公式
  • 通过公式对条件概率进行建模,对于已知概率的观测序列X,求其发生的情况下,各个序列y的发生概率。
  • t j t_j tj是转移特征函数,主要衡量相邻状态 y之间的影响,同时可以与x相关联
  • s k s_k sk是状态特征函数,主要衡量观测序列 x对状态变量的影响
  • λ \lambda λ和 μ \mu μ是对应特征函数的权重
  • exp用于定义模型中的概率分布函数
  • Z是规范化因子,用于确保式子是一个概率

过程

CRF模型完全由特征函数和权重决定:

  • 训练阶段(编码)用优化算法迭代,调个包就行
  • 预测阶段(解码) 使用维特比算法(动态规划,类似广度优先搜索),寻找概率最高的标签路径
    • 使用暴力搜索不可能,使用贪心算法未必是全局最优


PS

转移矩阵 (Transition Matrix):

  • 这是CRF模型中的一个矩阵,用于表示从一个状态(或标签)转移到另一个状态的概率。对于序列标注任务来说,状态可以是不同的标签(如B(开头)、I(中间)、O(其他)),转移矩阵告诉模型在给定前一个标签后,下一个标签出现的可能性有多大。

发射矩阵 (Emission Matrix):

  • 发射矩阵用于表示观察到某个状态下特定观察值的概率。在序列标注中,观察值通常是输入的词语或特征,而状态则是对应的标签。发射矩阵告诉模型在给定一个标签时,观察到具体词语的概率。

得分矩阵 (Score Matrix):

  • 得分矩阵是指CRF模型为每个可能的标签序列分配的分数。这些分数基于转移矩阵和发射矩阵的组合计算得出,通常利用动态规划算法(如维特比算法)来确定最佳的标签序列。
相关推荐
Asher阿舍技术站17 小时前
【AI基础学习系列】五、AIGC从创意到创造
人工智能·学习·aigc·进阶
ZhengEnCi17 小时前
05. 文本分块策略设计
人工智能
前端不太难17 小时前
AI 如何改变传统 鸿蒙App 的信息架构
人工智能·架构·harmonyos
汽车软件工程师00117 小时前
ChatGpt指导嵌入式软件开发能力——2、TriCore深度专项训练
人工智能·chatgpt·autosar
咚咚王者17 小时前
人工智能之视觉领域 计算机视觉 第八章 图像边缘检测
人工智能·opencv·计算机视觉
minhuan17 小时前
大模型应用:规则引擎 + 混元大模型:确定性骨架与智慧大脑的新融合实践.89
人工智能·大模型应用·规则引擎说明·rule-engine应用
数字生命卡兹克17 小时前
2026马年春晚15个关于AI的看点 - 有一种人类之外的美。
人工智能
Fairy要carry17 小时前
面试-SPO
人工智能
十步杀一人_千里不留行17 小时前
当代码评审成为手工业遗风
人工智能
AI浩17 小时前
SSVP:用于工业零样本异常检测的协同语义-视觉提示
人工智能·机器学习