Named Entity Recognition with Bidirectional LSTM-CNNs(基于双向LSTM神经网络的命名实体识别)论文阅读

标题:Named Entity Recognition with Bidirectional LSTM-CNNs

(于双向LSTM神经网络的命名实体识别)

作者:Jason P .C. Chiu,Eric Nichols

单位: 哥伦比亚大学,本田研究所

发表期刊:CL

发表时间:2016年

论文研究主题归类:自然语言处理

1.论文解决什么问题

本文提出了提出了一种新的神经网络架构,这个架构可以通过使用双向LSTM和CNN的混合模型自动提取单词级和字符级的特征,避免了大量特征工程的工作。

提出了词汇表部分匹配算法,通过BIOES Annotation 去对词汇表中的单词前缀后缀进行匹配。通过引入使用公共资源构建的词汇表,本文的模型在CONLL-2003数据集上取得91.62的F1值,在OneNotes数据集上取得86.28的F1值。

2.是否有公开的数据集及源代码

数据集:CoNLL 2003 Dataset | Papers With Code

DBpedia Dataset | Papers With Code

https://paperswithcode.com/dataset/ontonotes-5-0

源代码:https://github.com/flairNLP/flair

3.论文的主要观点

作者认为命名实体识别是一项具有挑战性的任务,传统上需要特征工程和词典形式的大量知识才能实现高性能。为了处理变长序列,我们可以使用RNN模型,但是为了改变RNN无法提取长距离的依赖,衍生出了LSTM模型。一个双向的LSTM模型能够考虑单词两边的所有有用的信息。

相关推荐
不会学习的小白O^O7 小时前
神经网络----卷积层(Conv2D)
人工智能·深度学习·神经网络
非极限码农8 小时前
基于Deepseek的语言润色助手API实现与部署指南
python·微服务·自然语言处理
那就摆吧10 小时前
U-Net vs. 传统CNN:为什么医学图像分割需要跳过连接?
人工智能·神经网络·cnn·u-net·医学图像
图灵学术计算机论文辅导12 小时前
提示+掩膜+注意力=Mamba三连击,跨模态任务全面超越
论文阅读·人工智能·经验分享·科技·深度学习·考研·计算机视觉
Mr Sorry13 小时前
TIME WEAVER: A Conditional Time Series Generation Model论文阅读笔记
论文阅读·笔记
有Li13 小时前
通过观看数百个外科手术视频课程来学习多模态表征|文献速递-医学影像算法文献分享
论文阅读·医学生
2301_8036527415 小时前
RLHF-V原论文阅读
论文阅读
8Qi815 小时前
深度学习(鱼书)day08--误差反向传播(后三节)
人工智能·python·深度学习·神经网络
海绵波波10715 小时前
解读LISA:通过大型语言模型实现推理分割
人工智能·语言模型·自然语言处理
海森大数据16 小时前
神经网络“开窍”时刻:从死记位置到理解意义的语言奇点
人工智能·深度学习·神经网络