【机器学习300问】57、机器是如何读得懂文本数据的呢?

你知道的,人工智能的大佬们想方设法的让机器具备人一样的能力,比如读懂文本的能力。既然机器是在模仿人类,那么问题"机器是如何读得懂文本数据的呢?"就可以变成"人是如何读得懂文本数据的呢?"

一、人是如何读得懂文本数据的?

想象你在教一个小孩子阅读一本书,如果他在还未学习字母和单词的情况下,是无法理解这篇文章的。首先,他需要学习各种字母,然后学习如何把字母拼接成单词,再学习如何把单词连成句子,最后才能理解文章的意思。

也就说,人类要想读懂文本,可以拆解成下面这几个步骤:

  1. 学习字词的基本含义
  2. 理解复杂句式
  3. 理解上下文
  4. 理解整篇文章主旨

二、机器是如何读得懂文本数据的?

"小孩子"变成了"人工智能",机器读取文本数据的过程犹如人类学习语言的过程。依旧要遵循上面总结出来的几个步骤,让我们结合"智能小孩"学习如何读懂文本的例子,来深入剖析每个步骤中人工智能都是怎么起作用的。

(1)学习字词的基本含义

① 学习字母------识别符号

开始的时候,"智能小孩"并不认识任何字母,这本书对它来说就像是一个充满了没有意义的符号的神秘领域。在机器学习中,这个阶段相当于我们使用字符级表示,其中机器通过大量的训练数据来学习语言的基本构件,即字母和它们如何形成文本中的符号序列。比如,先训练我们的机器模型识别ASCII字符,比如"A"是65,"B"是66等。就像幼儿园孩子学习ABC一样。在机器学习中,这可以通过字符级别的识别来完成,用一个简单的神经网络来对每个字符编码。

② 拼写单词------词嵌入和字典

随着训练的进行,"智能小孩"逐渐学会识别字母的组合也就是单词。这点可以通过使用词汇表或字典来实现。在机器学习中,这个过程是通过词嵌入(Word Embeddings)来完成的,它将每个单词转化为高维空间中的一个向量,这些向量能够捕捉单词之间的相似性和语义关系。相似含义的词在这个空间中距离较近。比如,"apple"和"orange"作为水果类别的词,它们的向量表示在空间上的位置就可能比较接近。

(2)理解复杂句式

在理解句子层面,递归神经网络(RNN)、长短时记忆网络(LSTM)、门控循环单元(GRU)等序列模型发挥了关键作用。这些模型可以捕捉到句子的时间或结构信息,例如识别出主语、谓语、宾语之间的关系,理解动词的时态和语态,以及处理条件句、并列句等复杂句型。比如,"THE APPLE IS RED"。就像孩子开始学习语法规则一样,我们可能会用一个RNN/LSTM来捕捉序列中的单词顺序。

(3)理解上下文

Transformer架构(如BERT, GPT系列)是目前解决上下文理解问题的重要突破。它通过自注意力机制,使得模型在处理每个词时都能考虑整个句子或段落的上下文信息。比如,当模型看到"bank"一词时,如果前后文是在谈论金融机构,则它的含义可能是存钱的地方;若前后文是河流环境,则可能是指河岸边缘。

(4)理解整篇文章主旨

对于篇章级别的理解,往往需要模型具有抽象概括和逻辑推理的能力。这可以通过预训练-微调框架(如BERT用于下游任务时)和特定任务的模型设计(如文档级别摘要生成模型、主题模型等)来实现。模型需要分析各部分之间的联系,提取出文章的关键信息,并形成对全文主旨的概括或推断。

机器理解文本数据的过程是一个逐步升级的认知过程,从底层的词义理解,到中层的句子理解,再到高层的文章含义理解,每一层都在努力模拟并逼近人类的语言认知和思考模式。

相关推荐
小龙报几秒前
【Coze-AI智能体平台】Coze OpenAPI 开发手册:鉴权、接口调用与 SDK 实践
javascript·人工智能·python·深度学习·microsoft·文心一言·开源软件
科技苑几秒前
告别付费枷锁:在家电脑自建大模型,Token自由不是梦
人工智能·时序数据库
TDengine (老段)3 分钟前
TDengine IDMP 可视化 —— 饼图
大数据·数据库·人工智能·物联网·时序数据库·tdengine·涛思数据
Flying pigs~~8 分钟前
从“踩坑”到“可控”:大模型 Prompt 工程实战总结与进阶方法论
大数据·人工智能·大模型·prompt·提示词工程
safestar201215 分钟前
Agent系统架构中的「注意力聚焦模式」:从理论到工程实践
人工智能·ai·系统架构·ai编程
星马梦缘20 分钟前
rl库 AttributeError: ‘bool‘ object has no attribute ‘items‘ 的解决方案
人工智能·深度学习·机器学习·强化学习
China_Yanhy21 分钟前
Gemini said动手学大模型第二篇学习总结:从“调参”到“调教”
人工智能
老马952722 分钟前
opencode2-初步体验
人工智能·后端
开开心心_Every24 分钟前
免费轻量电子书阅读器,多系统记笔记听书
linux·运维·服务器·神经网络·安全·机器学习·pdf
宇擎智脑科技31 分钟前
Claude Code 源码分析(七):终端 UI 工程 —— 用 React Ink 构建工业级命令行界面
前端·人工智能·react.js·ui·claude code