【ChatGPT】意义空间与语义运动定律 —— AI 世界的神秘法则

作者介绍

斯蒂芬•沃尔弗拉姆(Stephen Wolfram)

计算机科学家、数学家和理论物理学家,当今科学和技术领域重要的革新者之一。他创造了在全世界备受推崇的软件系统------Mathematica、Wolfram|Alpha和Wolfram语言。

在 ChatGPT 内部,任何文本都可以被有效地表示为一个由数组成的数组,可以将其视为某种"语言特征空间"中一个点的坐标。因此,ChatGPT 续写一段文本,就相当于在语言特征空间中追踪一条轨迹。

现在我们会问:是什么让这条轨迹与我们认为有意义的文本相对应呢?是否有某种"语义运动定律"定义(或至少限制)了语言特征空间中的点如何在保持"有意义"的同时到处移动?

这种语言特征空间是什么样子的呢?以下是一个例子,展示了如果将这样的特征空间投影到二维平面上,单个词(这里是常见名词)可能的布局方式。

我们在介绍嵌入时见过一个包含植物词和动物词的例子。这两个例子都说明了,"语义上相似的词"会被放在相近的位置。

再看一个例子,下图展示了不同词性的词是如何布局的。

当然,一个词通常不只有"一个意思"(也不一定只有一种词性)。通过观察包含一个词的句子在特征空间中的布局,人们通常可以"分辨出"它们不同的含义,就像如下例子中的 crane 这个词(指的是"鹤"还是"起重机"?)。

看来,至少可以将这个特征空间视为将"意思相近的词"放在这个空间中的相近位置。但是,我们能够在这个空间中识别出什么样的额外结构呢?

例如,**是否存在某种类似于"平行移动"的概念,反映了空间的"平坦性"?**理解这一点的一种方法是看一下相似的词。

即使投影到二维平面上,也通常仍然有一些"平坦性的迹象",虽然这并不是普遍存在的。

那么轨迹呢?我们可以观察 ChatGPT 的提示在特征空间中遵循的轨迹,然后可以看到 ChatGPT 是如何延续这条轨迹的。

这里无疑没有"几何上显而易见"的运动定律。这一点儿也不令人意外,我们充分预期到了这会相当复杂。例如,即使存在一个"语义运动定律",我们也远不清楚它能以什么样的嵌入(实际上是"变量")来最自然地表述。

在上图中,我们展示了"轨迹"中的几步---在每一步,我们都选择了 ChatGPT 认为最有可能("零温度"的情况)出现的词。不过,我们也可以询问在某一点处可能出现的"下一个"词有哪些以及它们出现的概率是多少。

在这个例子中,我们看到的是由高概率词组成的一个"扇形",它似乎在特征空间中朝着一个差不多明确的方向前进。如果继续前进会发生什么?沿轨迹移动时出现的连续"扇形"如下所示。

下面是一幅包含 40 步的三维示意图。

这看起来很混乱,并且没有特别推动通过实证研究"ChatGPT 内部的操作"来识别"类似数学物理"的"语义运动定律"。

但也许我们只是关注了"错的变量"(或者错的坐标系),如果关注对的那一个,就会立即看到 ChatGPT 正在做"像数学物理一样简单"的事情,比如沿测地线前进。

但目前,我们还没有准备好从它的"内部行为"中"实证解码"ChatGPT 已经"发现"的人类语言的"组织"规律。

相关推荐
嘀咕博客9 分钟前
Kimi-Audio:Kimi开源的通用音频基础模型,支持语音识别、音频理解等多种任务
人工智能·音视频·语音识别·ai工具
Baihai_IDP10 分钟前
GPU 网络基础,Part 2(MoE 训练中的网络挑战;什么是前、后端网络;什么是东西向、南北向流量)
人工智能·llm·gpu
AI人工智能+15 分钟前
蒙古文识别技术:采用深度学习模型(CNN+RNN)处理蒙古文竖写特性,实现高精度识别
深度学习·ocr·蒙古文识别
Blacol20 分钟前
【MCP】Caldav个人日程助手
人工智能·mcp
l12345sy28 分钟前
Day31_【 NLP _1.文本预处理 _(4)文本特征处理、文本数据增强】
人工智能·深度学习·自然语言处理
说私域29 分钟前
开源AI智能名片链动2+1模式S2B2C商城小程序在公益课裂变法中的应用与影响研究
人工智能·小程序
0xCode 小新38 分钟前
【C语言内存函数完全指南】:memcpy、memmove、memset、memcmp 的用法、区别与模拟实现(含代码示例)
linux·c语言·人工智能·深度学习·机器学习·容器·内存函数
Elastic 中国社区官方博客39 分钟前
如何在 vscode 里配置 MCP 并连接到 Elasticsearch
大数据·人工智能·vscode·elasticsearch·搜索引擎·ai·mcp
三掌柜6661 小时前
2025三掌柜赠书活动第三十五期 AI辅助React Web应用开发实践:基于React 19和GitHub Copilot
前端·人工智能·react.js
机器之心1 小时前
强强联手!深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码
人工智能·openai