NLP基础知识4【CRF】

目录

基本原理

  • X是输入文本(观测序列)
  • y是输出标签(状态序列)
    特点:
  • 每个状态都可以整个 观测序列决定,与 x 1 , x 2 , . . . . . x n {x_1,x_2,.....x_n} x1,x2,.....xn都相关,实际上一般是上下文10个token就可以了。
  • 对每一个状态y仅与相邻状态 y i − 1 , y i + 1 y_{i-1},y_{i+1} yi−1,yi+1相关
    # 公式
  • 通过公式对条件概率进行建模,对于已知概率的观测序列X,求其发生的情况下,各个序列y的发生概率。
  • t j t_j tj是转移特征函数,主要衡量相邻状态 y之间的影响,同时可以与x相关联
  • s k s_k sk是状态特征函数,主要衡量观测序列 x对状态变量的影响
  • λ \lambda λ和 μ \mu μ是对应特征函数的权重
  • exp用于定义模型中的概率分布函数
  • Z是规范化因子,用于确保式子是一个概率

过程

CRF模型完全由特征函数和权重决定:

  • 训练阶段(编码)用优化算法迭代,调个包就行
  • 预测阶段(解码) 使用维特比算法(动态规划,类似广度优先搜索),寻找概率最高的标签路径
    • 使用暴力搜索不可能,使用贪心算法未必是全局最优


PS

转移矩阵 (Transition Matrix):

  • 这是CRF模型中的一个矩阵,用于表示从一个状态(或标签)转移到另一个状态的概率。对于序列标注任务来说,状态可以是不同的标签(如B(开头)、I(中间)、O(其他)),转移矩阵告诉模型在给定前一个标签后,下一个标签出现的可能性有多大。

发射矩阵 (Emission Matrix):

  • 发射矩阵用于表示观察到某个状态下特定观察值的概率。在序列标注中,观察值通常是输入的词语或特征,而状态则是对应的标签。发射矩阵告诉模型在给定一个标签时,观察到具体词语的概率。

得分矩阵 (Score Matrix):

  • 得分矩阵是指CRF模型为每个可能的标签序列分配的分数。这些分数基于转移矩阵和发射矩阵的组合计算得出,通常利用动态规划算法(如维特比算法)来确定最佳的标签序列。
相关推荐
这是个栗子几秒前
AI辅助编程(一) - ChatGPT
前端·vue.js·人工智能·chatgpt
发哥来了2 分钟前
主流AI视频生成商用方案选型评测:关键能力与成本效益分析
大数据·人工智能·音视频
机器学习之心5 分钟前
金融时间序列预测全流程框架:从SHAP特征选择到智能算法优化深度学习预测模型,核心三章实验已完成,尚未发表,期待有缘人!
人工智能·深度学习·金融
CoderJia程序员甲6 分钟前
GitHub 热榜项目 - 日榜(2026-02-01)
人工智能·ai·大模型·github·ai教程
渡我白衣9 分钟前
【MySQL基础】(2):数据库基础概念
数据库·人工智能·深度学习·神经网络·mysql·机器学习·自然语言处理
新缸中之脑11 分钟前
将CodeBERTa压缩到10KB以下
人工智能
Faker66363aaa13 分钟前
鲶鱼目标检测与识别:基于fovea_r50_fpn_gn-head-align模型的COCO数据集训练_1
人工智能·目标检测·计算机视觉
【赫兹威客】浩哥14 分钟前
交通违章识别数据集与YOLO系列模型训练成果
人工智能·深度学习·机器学习
B站计算机毕业设计超人15 分钟前
计算机毕业设计hadoop+spark+hive在线教育可视化 课程推荐系统 大数据毕业设计(源码+LW文档+PPT+讲解)
大数据·人工智能·hive·hadoop·scrapy·spark·课程设计
B站计算机毕业设计超人16 分钟前
计算机毕业设计PySpark+Hive+Django小红书评论情感分析 小红书笔记可视化 小红书舆情分析预测系统 大数据毕业设计(源码+LW+PPT+讲解)
大数据·人工智能·hive·爬虫·python·spark·课程设计