Named Entity Recognition with Bidirectional LSTM-CNNs(基于双向LSTM神经网络的命名实体识别)论文阅读

标题:Named Entity Recognition with Bidirectional LSTM-CNNs

(于双向LSTM神经网络的命名实体识别)

作者:Jason P .C. Chiu,Eric Nichols

单位: 哥伦比亚大学,本田研究所

发表期刊:CL

发表时间:2016年

论文研究主题归类:自然语言处理

1.论文解决什么问题

本文提出了提出了一种新的神经网络架构,这个架构可以通过使用双向LSTM和CNN的混合模型自动提取单词级和字符级的特征,避免了大量特征工程的工作。

提出了词汇表部分匹配算法,通过BIOES Annotation 去对词汇表中的单词前缀后缀进行匹配。通过引入使用公共资源构建的词汇表,本文的模型在CONLL-2003数据集上取得91.62的F1值,在OneNotes数据集上取得86.28的F1值。

2.是否有公开的数据集及源代码

数据集:CoNLL 2003 Dataset | Papers With Code

DBpedia Dataset | Papers With Code

https://paperswithcode.com/dataset/ontonotes-5-0

源代码:https://github.com/flairNLP/flair

3.论文的主要观点

作者认为命名实体识别是一项具有挑战性的任务,传统上需要特征工程和词典形式的大量知识才能实现高性能。为了处理变长序列,我们可以使用RNN模型,但是为了改变RNN无法提取长距离的依赖,衍生出了LSTM模型。一个双向的LSTM模型能够考虑单词两边的所有有用的信息。

相关推荐
Saniffer_SH1 小时前
搭载高性能GPU的英伟达Nvidia DGX Spark桌面性能小怪兽国内首台开箱视频!
人工智能·深度学习·神经网络·ubuntu·机器学习·语言模型·边缘计算
可触的未来,发芽的智生1 小时前
追根索源:换不同的词嵌入(词向量生成方式不同,但词与词关系接近),会出现什么结果?
javascript·人工智能·python·神经网络·自然语言处理
递归不收敛1 小时前
三、检索增强生成(RAG)技术体系
人工智能·笔记·自然语言处理
大象耶2 小时前
自然语言处理前沿创新方向与技术路径
论文阅读·人工智能·深度学习·计算机网络·机器学习
一个处女座的程序猿2 小时前
NLP之Embedding:Youtu-Embedding的简介、安装和使用方法、案例应用之详细攻略
人工智能·自然语言处理·embedding
咕咚-萌西4 小时前
MLLM-LLaVA-FL: Multimodal Large Language Model Assisted FederatedLearning
人工智能·语言模型·自然语言处理
DisonTangor4 小时前
PaddleOCR-VL: 通过0.9B超紧凑视觉语言模型增强多语言文档解析
人工智能·计算机视觉·语言模型·自然语言处理·开源·aigc
Theodore_10226 小时前
深度学习(3)神经网络
人工智能·深度学习·神经网络·算法·机器学习·计算机视觉
文火冰糖的硅基工坊6 小时前
[人工智能-大模型-70]:模型层技术 - 从数据中自动学习一个有用的数学函数的全过程,AI函数计算三大件:神经网络、损失函数、优化器
人工智能·深度学习·神经网络
油泼辣子多加14 小时前
【实战】自然语言处理--长文本分类(1)DPCNN算法
算法·自然语言处理·分类