[NLP Begin] Classical NLP Methods - HMM

文章目录

  • [Hidden Markov Models](#Hidden Markov Models)
    • [Initial State Probabilities](#Initial State Probabilities)
    • [Hidden state probabilities](#Hidden state probabilities)
    • [Emission probabilities](#Emission probabilities)
  • 参考

Hidden Markov Models

教材上给出了一个例子:

Initial State Probabilities

初始概率,举个例子:

Noun (N): 0.3

Verb (V): 0.2

Adjective (Adj): 0.5

Hidden state probabilities

From/To N V Adj
N 0.1 0.6 0.3
V 0.4 0.1 0.5
Adj 0.7 0.2 0.1

"众所周知"的规律,比如一个形容词后面大概率跟着一个名词;

Emission probabilities

Word N V Adj
that 0.1 0.1 0.8
person 0.8 0.1 0.1
is 0.1 0.8 0.1
great 0.1 0.1 0.8
running 0.1 0.8 0.1

比如that很大概率是一个形容词,有0.8这么大的概率;

开始计算,第一个单词是that

  • 它的初始概率如下:
    Noun (N): 0.3
    Verb (V): 0.2
    Adjective (Adj): 0.5
  • 发射概率如下:
    Noun (N) : 0.1
    Verb (V) : 0.2
    Adjective (Adj) : 0.5
  • 计算过程如下:
    For Noun : 0.3 × 0.1 = 0.03 0.3 \times 0.1 = 0.03 0.3×0.1=0.03
    For Verb : 0.2 × 0.1 = 0.02 0.2 \times 0.1 = 0.02 0.2×0.1=0.02
    For Adjective : 0.5 × 0.8 = 0.4 0.5 \times 0.8 = 0.4 0.5×0.8=0.4
    发现概率最大的是Adj,所以预测为Adj形容词;

接下来就可以继续接下里的过程,对接下来的每一个单词而言:

  • 该单词的某个tagemission probability
  • 从上一个被选择的tag到当前被选择tagtransistion probability
  • 将这些概率相乘,并且选择概率最高的tag
    到达最后一个单词之后,再回头来处理;
    假设ThattagAdj,再寻找persontag
    假设transition probabilities如下:
    Adj -> N : 0.7,
    Adj -> V : 0.2,
    Adj -> Adj : 0.1,
    person的emission probabilities:
    N : 0.8,
    V : 0.1,
    Adj : 0.1,
    相乘之后比较结果,预测为N的概率最大: 0.7 × 0.8 = 0.56 0.7 \times 0.8 = 0.56 0.7×0.8=0.56;

参考

Classical NLP Methods

相关推荐
广州灵眸科技有限公司几秒前
瑞芯微(EASY EAI)RV1126B yolov11-track多目标跟踪部署教程
linux·开发语言·网络·人工智能·yolo·机器学习·目标跟踪
灵动小溪2 分钟前
claude code工具PC安装部署
人工智能·算法
扬帆破浪4 分钟前
免费开源AI软件.桌面单机版,可移动的AI知识库,察元 AI桌面版:Windows装包被防病毒拦了 看安装日志和签名链的实战
人工智能·windows·开源·知识图谱
YuanDaima204811 分钟前
WSL2 与 Ubuntu 22.04 基础环境部署指南
linux·运维·服务器·人工智能·ubuntu·docker
初心未改HD11 分钟前
机器学习之决策树详解
人工智能·决策树·机器学习
GitFun14 分钟前
7.4 万 Star 的开源记忆系统,让 AI 编程助手不再“失忆
人工智能
数据门徒17 分钟前
神经网络原理 第七章:委员会机器
人工智能·神经网络·机器学习
HyperAI超神经22 分钟前
Token使用量降低30%,以「阿凡达」为灵感的异构智能体框架Eywa,高效结合语言模型与领域专用基础模型
人工智能·语言模型
xiaoxiaoxiaolll23 分钟前
《Nature Communications》论文解读:皮秒级单光子偏振测量如何绘制多模光纤中的模态动态图谱
网络·人工智能
Inhand陈工30 分钟前
城投公司地面与停车场监控改造实战:映翰通IR302 + GRE隧道实现RFID与视频数据远程汇聚
网络·人工智能·物联网·网络安全·智能路由器·信息与通信