知识图谱(五)

一机器学习,深度学习实现NER(序列标注)

1.1机器学习和深度学习完成NER(序列标注)

相同点:二者都需要对句子里面的对象进行标注

不同点:传统机器学习需要人工对对象特征标注,深度学习则是把分词后的结果转向量自己学习特征.

传统机器学习的缺点是每个词都需要人工标注特征,严重依赖人工设计的特征,机器学习常用的标注方法是bio.,常用的模型是CRF.

深度神经网络最常用的是BILSTM+CRF模型,缺点是训练模型需要大量人工标记的数据

1.2线性链条件随机场

给定线性输入序列x,输出线性序列Y.每个位置的标签只和相邻的标签以及本身x有关,和其他无关.

二:基于深度学习完成NER

2.1单条路径分数计算

发射分数权重矩阵的维度是(字符数,标签数),转移分数的权重矩阵是(标签数,标签数).

Eg:

最优路径的分数计算:(图上画错了,画了两个t10)

B-Person:E00+0.93

I-Person:E11+0.66

...........

最后相加可以得到单条路径的分数

2.2全部路径分数计算

路径总共有5**4条,路径数量很多,全部算出来很耗费资源.需要使用前向算法的动态规划.

三Viterbi算法解码

3.1viterbi算法作用

CRF计算所有路径分数得到分数矩阵以后,需要使用viterbi解码的方式获取得分最高的那条路径

3.2viterbi算法原理

前向算法寻找最短路径的方法:

viterbi算法寻找最短路径:

从A序列到B1有三条路径,选择最短路径

其他同上

得到三条路径:

同上,得到b到c序列的路径:

最后得到三条路径.

viterbi算法相较于前向的算法优势在于:只关注最优线路,而不是所有线路.

3.3viterbi解码在CRF模型中的应用

面试题:viterbi算法的复杂度和前向计算算法的复杂度分别是多少?

viterbi算法每列计算M*2次,复杂度为N*M**2

前向传播算法复杂度为M**N

相关推荐
B站_计算机毕业设计之家2 天前
电影知识图谱推荐问答系统 | Python Django系统 Neo4j MySQL Echarts 协同过滤 大数据 人工智能 毕业设计源码(建议收藏)✅
人工智能·python·机器学习·django·毕业设计·echarts·知识图谱
莫寒清3 天前
Apache Tika
java·人工智能·spring·apache·知识图谱
renhongxia14 天前
THINKSAFE:推理模型的自生成安全对齐
人工智能·深度学习·安全·语言模型·机器人·知识图谱
zhengfei6114 天前
【渗透工具】——PYDNS扫描器
知识图谱·安全威胁分析
KG_LLM图谱增强大模型4 天前
AgentRxiv:迈向协作式自主科学研究新范式
人工智能·知识图谱
小龙报5 天前
【Coze-AI智能体平台】Coze 工作流 = 智能体的 “流程管家”?一文解锁自动化落地新玩法
人工智能·语言模型·自然语言处理·性能优化·数据分析·知识图谱·需求分析
Loo国昌6 天前
【AI应用开发实战】05_GraphRAG:知识图谱增强检索实战
人工智能·后端·python·语言模型·自然语言处理·金融·知识图谱
KG_LLM图谱增强大模型6 天前
TKG-Thinker:通过智能体强化学习实现时序知识图谱的动态推理
人工智能·知识图谱
岱宗夫up8 天前
从代码模式到智能模式:AI时代的设计模式进化论
开发语言·python·深度学习·神经网络·自然语言处理·知识图谱