大模型是如何工作的

用户在可以使用自然语言与大模型交流,用户的文本就是"提示词"。提示词越清晰,模型的回答就越符合预期。

大模型处理提示词的工作流程可以分为两部分,第一部分是分词化与词表映射 ,第二部分为生成文本


分词化(Tokenization)与词表映射

分词化 (Tokenization)是自然语言处理(NLP)中的重要概念,它是将段落和句子分割成更小的分词(token)的过程。举一个实际的例子,以下是一个英文句子:

复制代码
I want to study English.

为了让机器理解这个句子,对字符串执行分词化,将其分解为独立的单元。使用分词化,我们会得到这样的结果:

复制代码
['I' ,'want' ,'to' ,'study' ,'English' ,'.']

将一个句子分解成更小的、独立的部分可以帮助计算机理解句子的各个部分,以及它们在上下文中的作用,这对于进行大量上下文的分析尤其重要。分词化有不同的粒度分类:

  • 词粒度分词化,如上文中例子所示,适用于大多数西方语言,如英语。
  • 字符粒度分词化,是中文最直接的分词方法,它是以单个汉字为单位进行分词化。
  • 子词粒度分词化,它将单词分解成更小的单位,比如词根、词缀等。这种方法对于处理新词(比如专有名词、网络用语等)特别有效,因为即使是新词,它的组成部分(子词)很可能已经存在于词表中了。

每一个token都会通过预先设置好的词表,映射为一个 token id,这是token 的"身份证",一句话最终会被表示为一个元素为token id的列表,供计算机进行下一步处理。

大语言模型生成文本的过程

大语言模型的工作概括来说是根据给定的文本预测下一个token。

对我们来说,看似像在对大模型提问,但实际上是给了大模型一串提示文本,让它可以对后续的文本进行推理。

大模型的推理过程不是一步到位的,当大模型进行推理时,它会基于现有的token,根据概率最大原则预测出下一个最有可能的token,然后将该预测的token加入到输入序列中,并将更新后的输入序列继续输入大模型预测下一个token,这个过程叫做自回归。直到输出特殊token(如"EOS",end of sentence,专门用来控制推理何时结束)或输出长度达到阈值。


文章内容整合于网络,如有侵权,请联系删除!

相关推荐
leo在掘金41 分钟前
从DeepSeek 510亿融资到GitHub 33K Star开源项目:这周的技术生态发生了什么?
人工智能
小姜前线技术2 小时前
AI流式渲染打字机效果抖动?节流方案踩坑实录
人工智能
用户018349301692 小时前
AI对话状态管理:useReducer还是XState
人工智能
先锋部队2 小时前
给AI对话加「停止生成」按钮:abort SSE实战
人工智能
新新技术迷2 小时前
移动端H5接AI对话的坑:键盘顶起与滚动到底
人工智能
aqi005 小时前
15天学会AI应用开发(七)有了大模型为什么还要引入RAG
人工智能·python·大模型·ai编程·ai应用
用户5191495848456 小时前
libcurl Headers API 释放后重利用漏洞:跨请求复用头句柄导致堆内存安全风险
人工智能·aigc
踩蚂蚁6 小时前
自定义语音唤醒词:从训练到部署的完整链路实践
人工智能
用户5191495848456 小时前
CVE-2025-1094 PostgreSQL SQL注入与WebSocket劫持远程代码执行利用工具
人工智能·aigc