自然语言处理(NLP)-概述

NLP

一、什么是自然语言处理(NLP)

什么是自然语言处理

二、NLP的发展

三、相关理论

1 语言模型

序列数据形式多样,如视频帧、音频数据等,其中文本是最常见的。
文本预处理

  • 1 将文本作为字符串加载到内存中。
  • 2 将字符串拆分为词元(如单词和字符)。
  • 3 建立一个词表,将拆分的词元映射到数字索引。
  • 4 将文本转换为数字索引序列,方便模型操作。
    假设长度为T的文本序列中的词元依次为 x 1 , x 2 , ... , x T x_1, x_2, \ldots, x_T x1,x2,...,xT。 于是 x t , 1 ≤ t ≤ T x_t, 1 \leq t \leq T xt,1≤t≤T, 可以被认为是文本序列在时间步t处的观测或标签。 在给定这样的文本序列时,语言模型(language model) 的目标是估计序列的联合概率 P ( x 1 , x 2 , ... , x T ) . P(x_1, x_2, \ldots, x_T). P(x1,x2,...,xT).

2 词向量表征和语义分析

3 深度学习

相关推荐
Raink老师5 小时前
【AI面试临阵磨枪-48】GraphRAG、多模态 RAG、自适应 RAG 原理
人工智能·ai 面试题
波动几何5 小时前
模式驱动的学术选题方法论——四种AI模式处理能力的系统建构与论证
人工智能
飞哥数智坊6 小时前
我为我的龙虾斩分身:OpenClaw 多智能体实操
人工智能·agent
七牛开发者6 小时前
HTML is the new Markdown:来自 Claude Code 团队的实践
前端·人工智能·语言模型·html
飞哥数智坊6 小时前
在二线城市做AI社群,我的五一节后到底有多疯狂?
人工智能
视***间6 小时前
智启边缘,魔盒藏锋——视程空间Pandora系列魔盒,解锁边缘计算普惠新范式
人工智能·区块链·边缘计算·ai算力·视程空间
蛐蛐蛐6 小时前
昇腾910B4上安装新版本CANN的正确流程
人工智能·python·昇腾
沪漂阿龙6 小时前
AI大模型面试题:线性回归是什么?最小二乘法、平方误差、正规方程、Ridge、Lasso 一文讲透
人工智能·机器学习·线性回归·最小二乘法
Lyon198505287 小时前
《文字定律》让AI体验,汉字逻辑与字母逻辑的差异——ChatGPT
人工智能·ai·chatgpt·ai写作
2601_957780847 小时前
Claude 4.6 对阵 GPT-5.4:2026 开发者大模型 API 选型深度解析
人工智能·python·gpt·ai·claude