Named Entity Recognition with Bidirectional LSTM-CNNs(基于双向LSTM神经网络的命名实体识别)论文阅读

标题:Named Entity Recognition with Bidirectional LSTM-CNNs

(于双向LSTM神经网络的命名实体识别)

作者:Jason P .C. Chiu,Eric Nichols

单位: 哥伦比亚大学,本田研究所

发表期刊:CL

发表时间:2016年

论文研究主题归类:自然语言处理

1.论文解决什么问题

本文提出了提出了一种新的神经网络架构,这个架构可以通过使用双向LSTM和CNN的混合模型自动提取单词级和字符级的特征,避免了大量特征工程的工作。

提出了词汇表部分匹配算法,通过BIOES Annotation 去对词汇表中的单词前缀后缀进行匹配。通过引入使用公共资源构建的词汇表,本文的模型在CONLL-2003数据集上取得91.62的F1值,在OneNotes数据集上取得86.28的F1值。

2.是否有公开的数据集及源代码

数据集:CoNLL 2003 Dataset | Papers With Code

DBpedia Dataset | Papers With Code

https://paperswithcode.com/dataset/ontonotes-5-0

源代码:https://github.com/flairNLP/flair

3.论文的主要观点

作者认为命名实体识别是一项具有挑战性的任务,传统上需要特征工程和词典形式的大量知识才能实现高性能。为了处理变长序列,我们可以使用RNN模型,但是为了改变RNN无法提取长距离的依赖,衍生出了LSTM模型。一个双向的LSTM模型能够考虑单词两边的所有有用的信息。

相关推荐
呆萌很8 天前
卷积神经网络的基石——基础卷积模块
神经网络
海天一色y8 天前
粒子群算法(PSO)优化BP神经网络:从原理到实战
人工智能·深度学习·神经网络
有梦想的攻城狮9 天前
卷积神经网络(CNN)详解
人工智能·神经网络·cnn·卷积神经网络
NGBQ121389 天前
Imgflip社交媒体表情包数据集-202208条多模板meme数据-包含完整图片URL和文本说明-适用于NLP模型训练和社交媒体分析
人工智能·自然语言处理·媒体
LaughingZhu9 天前
Product Hunt 每日热榜 | 2026-02-25
数据库·人工智能·经验分享·神经网络·chatgpt
薛定e的猫咪9 天前
【AAAI 2025】基于扩散模型的昂贵多目标贝叶斯优化
论文阅读·人工智能·算法
wearegogog1239 天前
基于神经网络、强化学习、模糊逻辑和小波相结合的混合方法控制欠驱动系统
人工智能·深度学习·神经网络
homelook9 天前
Transformer架构,这是现代自然语言处理和人工智能领域的核心技术。
人工智能·自然语言处理·transformer
YMWM_9 天前
论文阅读“SimVLA: A Simple VLA Baseline for Robotic Manipulation“
论文阅读·vla
赋创小助手9 天前
服务器主板为何不再采用ATX?以超微X14DBM-AP 为例解析
运维·服务器·人工智能·深度学习·自然语言处理·硬件架构