自然语言处理相关基本概念

基本概念章节总结

一、语言学(Linguistics)
  1. 定义

    • 研究语言的本质、结构和发展规律的科学,涵盖语音、文字、语法等属性。
    • 分支包括历时语言学、共时语言学、描述语言学等。
  2. 核心内容

    • 分析语言的形态、句法、语义等层面,如词素(词根、前缀、后缀等)的构成规则。
二、计算语言学(Computational Linguistics, CL)
  1. 定义

    • 通过建立形式化计算模型分析、理解和生成自然语言的交叉学科,涉及计算机科学、语言学、数学。
    • 更侧重基础理论和方法研究,如算法设计与模型构建。
  2. 发展里程碑

    • 1962年:美国成立"机器翻译和计算语言学学会(ACL)",召开首届国际计算语言学学术年会。
    • 1966年:术语"Computational Linguistics"在ALPAC报告中正式出现。
三、自然语言理解(Natural Language Understanding, NLU)
  1. 定义

    • 探索人类语言认知过程,研究模仿人类语言理解的技术,是人工智能的核心目标之一,被誉为"人工智能皇冠上的明珠"。
  2. 评估标准

    • 图灵测试:通过人机对话判断机器是否具备智能,但存在争议。
四、自然语言处理(Natural Language Processing, NLP)
  1. 定义

    • 研究利用计算机技术对文本进行处理和加工的学科,包括词法分析、句法分析、语义提取等技术。
  2. 与其他学科的关系

    • 与计算语言学(CL):CL侧重理论,NLP侧重工程实现,两者常被视为同一领域。
    • 与自然语言理解(NLU):NLU是NLP的终极目标,NLP是实现NLU的技术手段。
    • 人类语言技术(HLT):涵盖CL、NLP、NLU,是人工智能中最具挑战性的方向之一。
五、中文信息处理
  1. 定义

    • 针对中文的自然语言处理技术,因汉语属于孤立语(几乎无形态变化,依赖词序和虚词),处理方法具有特殊性。
  2. 汉语的特点

    • 属于孤立语(分析语),与屈折语(如英语)、黏着语(如日语)形成对比。
    • 中文分词、词性标注等任务需考虑汉语的结构特性(如无空格分隔词语)。
六、学科概念关系图解
plaintext 复制代码
HLT(人类语言技术)
    ├─ CL(计算语言学):理论基础
    ├─ NLP(自然语言处理):技术实现
    └─ NLU(自然语言理解):核心目标
七、关键区分点
概念 核心目标 研究方法 典型应用
语言学 描述语言规律 理论分析 语法研究
计算语言学 建立语言计算模型 形式化算法与模型 句法分析模型
自然语言处理 实现文本自动化处理 工程技术(如分词、翻译) 机器翻译、信息检索
自然语言理解 让机器理解语义与意图 人工智能算法(如深度学习) 对话系统、问答系统
八、重要术语补充
  • 图灵测试:判断机器是否具备智能的标准,通过人机对话区分机器与人类反应。
  • 语系分类
    • 屈折语:英语、法语(用词形变化表示语法关系);
    • 黏着语:日语、韩语(用附加成分表示语法意义);
    • 孤立语:汉语、越南语(靠词序和虚词表达语法关系)。

通过以上总结,可清晰梳理自然语言处理领域的核心概念及其相互关系,为后续学习奠定理论基础。

相关推荐
共绩算力27 分钟前
OpenAI Whisper 语音识别模型:技术与应用全面分析
人工智能·whisper·语音识别·共绩算力
工藤学编程38 分钟前
零基础学AI大模型之Stream流式输出实战
人工智能
不良人龍木木1 小时前
机器学习-常用库
人工智能·机器学习
罗橙7号1 小时前
【pyTorch】关于PyTorch的高级索引机制理解
人工智能·pytorch·python
rengang661 小时前
09-随机森林:介绍集成学习中通过多决策树提升性能的算法
人工智能·算法·随机森林·机器学习·集成学习
zskj_qcxjqr1 小时前
数字大健康浪潮下:智能设备重构人力生态,传统技艺如何新生?
大数据·人工智能·科技·机器人
梦想画家2 小时前
Cohen‘s Kappa系数:衡量分类一致性的黄金标准及其在NLP中的应用
自然语言处理·分类·数据挖掘
动能小子ohhh2 小时前
AI智能体(Agent)大模型入门【9】--如何在pycharm等其他编译软件调用ocr工具【只写后端代码不演示】
人工智能·python·深度学习·机器学习·pycharm·ocr
mit6.8242 小时前
[Tongyi] 工具集成 | run_react_infer
人工智能·深度学习·算法
无锡布里渊2 小时前
分布式光纤声波振动传感:守护智慧城市燃气管网安全的 “神经末梢”
人工智能·安全·智慧城市