CMU Subword Modeling | 11 Rules of realization and rules of referral

这次课是在讲一种叫 Construction Morphology(构式形态学) 的方法,重点解释了:

  • 规则(Rules of Realization 和 Rules of Referral)在形态学中的角色
  • 构式形态学如何用"模式(schema)"组织词和意义的关系
  • 它跟传统的词与形态划分(如单纯把词切成 morpheme)有什么不同 (Dmort27)

1. 什么是 Construction Morphology(构式形态学)

想象你学乐高:

  • 传统的形态学可能会把一个词看成一堆 Lego 砖块(morphemes)拼起来;
  • 构式形态学则像看 "模块化的 Lego 模式(schema)" :不是强制把每个词分成小块,而是更像:
    • 有些部件组合成了一种 结构模式
    • 然后这个模式可以在不同词里反复"实例化(instance)"
    • 甚至可以表示语义和形式之间的对应关系(不是只是形式拼接)

2. 关键概念解释

1) Construction(构式)

一个构式是一个 形式(form)+意义(meaning) 的组合:

  • 它可以是具体的单词(例如 dirtbag
  • 也可以是一个更抽象的模式 (比如 "某类词 → 表示某种意思的构造法则")(Dmort27)

"构式就像一个图纸,不是只有形状,也有它的意思。"

2) Rules of Realization(实现规则)

这类规则是告诉我们:当你有某种抽象意义 + 形式结构时 → 具体的词是怎么生成的?

比如:[[x]Ni[bag]]N ↔ unpleasant person who is a metaphorical container for SEMi

这个公式的意思是:

  • 左边是形式结构:一个词根 + bag
  • 右边是对应的意思:表示某种不愉快的人
  • ↔ 表示 形式与意思之间的一一对应关系 (realization)(Dmort27)

想象每个词都有一个"造词规则"。

规则里写:"给我一个意思 + 词根,我就能生成相应词。"

所以这是 有意义的组合,不是随意拼接。

3) Rules of Referral(引导规则)

这些规则不是直接 "生成形态",

它们更像是: 把一个构式"链接"到另一个构式 或者 引导去使用另一个更基本的规则

它的作用类似:

"如果你知道 X 怎么组成,那么也可以推出 X 之类似形式 如何理解。"

更学术一点,它不是严格的语法规则,而是一种 许可(licensing)机制

如果某个组合可接受,那另一个基于它的组合也可能是可接受的(但不是强制的)。

这更像是 NLP 里常说的:"模型从数据中归纳出:某种组合是合理的 → 推断其他组合也可能合理"

3. 举个简单的例子

假设有:

  • 规则 A :构造 agent(做某事的人)------例如 walkwalker
  • 规则 B :构造 patient(被动作的人或对象)------例如 walkwalkee

构式形态学会这样定义:

复制代码
[ V do x ] [ N person who does x ]  ↔  Xer  (agent)
[ V do x ] [ N person to whom x is done ]  ↔  Xee  (patient)

这意味着,如果你知道某个动词 "walk",那么你对应有:

  • walker(做 walk 的人)
  • walkee(被 walk 的人 / 事物)

这种方式和我们在某些 NLP 实验中看到的现象很像:LLMs 没有简单把词拆成 morpheme 拼接 ,而是靠"看到类似单词→ 推断规律→ 应用于新词"。(Dmort27)

4. 构式形态学跟传统形态学比起来有什么不同?

传统形态学 构式形态学
词 = morphemes 的串接 词是 form+meaning 的构式
规则是硬性的 规则是许可性的(licensed)
拼接看重形式 更强调形式与意义的对应

换句话说 (Dmort27):

  • 构式形态学 更像认知和使用导向
  • 不再是字面分解,而是理解模式与归纳规则
  • 更贴近现代 NLP 和 LLM 学到的"类比"机制显现的规律性

小结

  1. 构式形态学不是把词拆得更细,而是理解词怎么构造、它的意义怎么对应。
  2. Rules of Realization 是"给出某种 abstract meaning → 生成具体词"。
  3. Rules of Referral 是"规则之间的桥梁,让一种构式借助另一种构式合理化"。
  4. 它和传统的切割 morphemes 不一样,更像是"模式 + 实例 + 语义对应"。
  5. 这种观点跟我们观察到大型语言模型里 morphology 行为更贴近类比和模式匹配。
相关推荐
宝贝儿好1 小时前
【强化学习实战】第十一章:Gymnasium库的介绍和使用(1)、出租车游戏代码详解(Sarsa & Q learning)
人工智能·python·深度学习·算法·游戏·机器学习
绝世这天下3 小时前
【在 DGX Spark 上运行 vLLM-Omni 用于 Qwen3-TTS(语音设计,语音克隆)】
人工智能
陈大鱼头4 小时前
[译]费尽心思来保障 OpenClaw ?那跟直接用 GPT 有什么区别?
人工智能
Fleshy数模4 小时前
玩转OpenCV:视频椒盐噪声处理与图像形态学操作实战
人工智能·opencv·音视频
幂律智能4 小时前
Agent × 流程引擎融合架构:从静态流程到智能流程编排
人工智能·架构·agent
无垠的广袤4 小时前
ChatECNU 大语言模型与 PicoClaw 部署
人工智能·语言模型·自然语言处理·嵌入式·树莓派
爱淋雨的男人5 小时前
自动驾驶感知相关算法
人工智能·算法·自动驾驶
互联网科技看点5 小时前
AI算力爆发叠加数据资产风口,铂拉锐科技布局去中心化数字生态
人工智能·科技·去中心化
如若1235 小时前
flash-attn 安装失败?从报错到成功的完整排雷指南(CUDA 12.8 + PyTorch 2.7)
人工智能·pytorch·python
七牛云行业应用5 小时前
GPT-5.4能力前瞻:解析原生电脑操控(Computer Use)原理与Agent架构构建
人工智能·chatgpt·大语言模型·ai agent·mcp协议