基础概念
20世纪60年代,机器怎么理解自然语言

上图是早期对自然语言处理的理解

自然语言处理(NLP)因对人类语言的计算建模与分析需求日益增长而备受关注。其应用场景已覆盖机器翻译、垃圾邮件检测、信息提取、自动摘要、医疗诊断及问答系统等多个领域。
1.前言
自然语言处理(NLP)作为人工智能与语言学的交叉领域,专注于通过计算机技术解析人类语言中的语句或词汇。
其核心目标在于减少用户操作负担,实现以自然语言为媒介的人机交互。由于多数用户对机器语言缺乏了解,NLP技术使得这类用户能够直接使用日常语言与设备沟通。
语言本质上是由规则或符号构成的系统。人们通过符号的组合实现信息传递或发布。
NLP技术主要涵盖两大分支:自然语言理解(NLU)和自然语言生成(NLG),分别对应文本解析与内容生成两大功能任务(图 1)。

图 1:NLP 的粗分类
语言学作为研究语言的科学体系,涵盖多个核心分支:其中音系学(Phonology)聚焦声音表征,词态学(Morphology)探究构词规律,句法学(Syntax)解析语句结构,语义句法学(Semantics syntax)与语用学(Pragmatics)共同构成意义理解的基础框架。
自然语言处理(NLP)的典型研究任务包括:自动摘要(将文本关键信息按特定格式浓缩)、指代消解(Co-Reference Resolution)(识别跨句子的指代同一性)、语篇分析(构建文本的宏观结构)、机器翻译(实现跨语言自动转换)、语素切分(Morphological Segmentation)(分解词汇并标注词素类别)、命名实体识别(NER)(定位专有名词)、光学字符识别(OCR)(从PDF等文档中提取文字)以及词性标注(判定句子中每个单词的语法属性)。
尽管这些任务在表面形态上差异显著,但在实际应用中往往需要多任务协同处理。
2.NLP 的层级
作为自然语言处理(NLP)领域最具解释性的框架,语言层级通过以下三个关键阶段实现文本生成:内容规划(Content Planning)、语句规划(Sentence Planning)与表层实现(Surface Realization)。(图 2)。

图 2:NLP 架构的阶段
语言学是涉及到语言、语境和各种语言形式的学科。与 NLP 相关的重要术语包括:
音系学
形态学
词汇学
句法学
语义学
语篇分析
语用学
3.自然语言生成
NLG 是从内在表征生成有含义的短语、句子和段落的处理过程。
它是 NLP 的一部分,包括四个阶段:确定目标、通过场景评估规划如何实现目标、可用的对话源、把规划实现为文本,如下图 3。生成与理解是相反的过程。

图 3:NLG 的组件
4.NLP 的应用
NLP 可被他应用于各种领域,例如机器翻译、垃圾邮件检测、信息提取等。在这一部分,该论文对以下 NLP 的应用进行了介绍:
机器翻译
文本分类
垃圾邮件过滤
信息提取
自动摘要
对话系统
医疗
5.深度学习中的 NLP
原文对自然语言处理(NLP)的基础性介绍存在一定局限,尤其是未充分涵盖深度学习在该领域的最新应用进展。
为此,我们引用了北京理工大学的研究论文,系统梳理了NLP中与深度学习相关的核心模型与方法,包括卷积神经网络(CNN)、循环神经网络(RNN)、递归神经网络(RecNN)。
同时深入探讨了记忆增强策略、注意力机制,以及无监督模型、强化学习模型、深度生成模型在语言任务中的实践应用。
此外,论文还全面分析了当前主流深度学习框架,旨在从技术演进视角呈现NLP的发展全貌。
近年来,深度学习在计算机视觉与模式识别领域的突破性成果,显著推动了基于新方法的NLP研究热潮。
传统NLP解决方案长期依赖浅层机器学习模型(如SVM和logistic回归),其训练过程需处理高维稀疏特征。
而近年来,基于密集向量表征的神经网络在多项NLP任务中表现优异,这一变革源于词嵌入技术与深度学习的成功结合。
深度学习实现了多层次自动特征学习的可能,彻底改变了传统NLP系统依赖人工设计特征的耗时且不完备的现状。
2011年,Collobert等学者通过实验证实,即便是基础的深度学习框架,也能在实体命名识别(NER)、语义角色标注(SRL)、词性标注(POS tagging)等任务中超越传统最优方法。
此后,更复杂的深度学习算法被相继提出以应对NLP挑战。
该论文不仅总结了CNN、RNN、RecNN等关键模型,还详细阐述了记忆增强策略、注意力机制,以及无监督/强化学习模型、深度生成模型在语言任务中的创新应用。
2016年Goldberg的教程虽对NLP中的深度学习技术(如word2vec、CNN)进行了概述,但未系统讨论各类架构设计。
相比之下,当前论文提供了更完整的理论框架与实践视角。

摘要:通过多层处理结构学习数据的层次化特征,深度学习方法已在多个领域取得最优性能。
近年来,自然语言处理领域涌现出众多创新模型与技术。本文系统梳理了NLP任务中与深度学习相关的核心模型与方法,并全面综述其发展脉络。
通过对比分析各类模型,深入阐释了NLP中深度学习的历史演进、当前进展与未来趋势。

一个 D 维向量的分布式向量表达,其中 D << V,V 是词汇的大小。
更多AI大模型学习视频及资源,都在智泊AI。