CMU Subword Modeling | 11 Rules of realization and rules of referral

这次课是在讲一种叫 Construction Morphology(构式形态学) 的方法,重点解释了:

  • 规则(Rules of Realization 和 Rules of Referral)在形态学中的角色
  • 构式形态学如何用"模式(schema)"组织词和意义的关系
  • 它跟传统的词与形态划分(如单纯把词切成 morpheme)有什么不同 (Dmort27)

1. 什么是 Construction Morphology(构式形态学)

想象你学乐高:

  • 传统的形态学可能会把一个词看成一堆 Lego 砖块(morphemes)拼起来;
  • 构式形态学则像看 "模块化的 Lego 模式(schema)" :不是强制把每个词分成小块,而是更像:
    • 有些部件组合成了一种 结构模式
    • 然后这个模式可以在不同词里反复"实例化(instance)"
    • 甚至可以表示语义和形式之间的对应关系(不是只是形式拼接)

2. 关键概念解释

1) Construction(构式)

一个构式是一个 形式(form)+意义(meaning) 的组合:

  • 它可以是具体的单词(例如 dirtbag
  • 也可以是一个更抽象的模式 (比如 "某类词 → 表示某种意思的构造法则")(Dmort27)

"构式就像一个图纸,不是只有形状,也有它的意思。"

2) Rules of Realization(实现规则)

这类规则是告诉我们:当你有某种抽象意义 + 形式结构时 → 具体的词是怎么生成的?

比如:[[x]Ni[bag]]N ↔ unpleasant person who is a metaphorical container for SEMi

这个公式的意思是:

  • 左边是形式结构:一个词根 + bag
  • 右边是对应的意思:表示某种不愉快的人
  • ↔ 表示 形式与意思之间的一一对应关系 (realization)(Dmort27)

想象每个词都有一个"造词规则"。

规则里写:"给我一个意思 + 词根,我就能生成相应词。"

所以这是 有意义的组合,不是随意拼接。

3) Rules of Referral(引导规则)

这些规则不是直接 "生成形态",

它们更像是: 把一个构式"链接"到另一个构式 或者 引导去使用另一个更基本的规则

它的作用类似:

"如果你知道 X 怎么组成,那么也可以推出 X 之类似形式 如何理解。"

更学术一点,它不是严格的语法规则,而是一种 许可(licensing)机制

如果某个组合可接受,那另一个基于它的组合也可能是可接受的(但不是强制的)。

这更像是 NLP 里常说的:"模型从数据中归纳出:某种组合是合理的 → 推断其他组合也可能合理"

3. 举个简单的例子

假设有:

  • 规则 A :构造 agent(做某事的人)------例如 walkwalker
  • 规则 B :构造 patient(被动作的人或对象)------例如 walkwalkee

构式形态学会这样定义:

复制代码
[ V do x ] [ N person who does x ]  ↔  Xer  (agent)
[ V do x ] [ N person to whom x is done ]  ↔  Xee  (patient)

这意味着,如果你知道某个动词 "walk",那么你对应有:

  • walker(做 walk 的人)
  • walkee(被 walk 的人 / 事物)

这种方式和我们在某些 NLP 实验中看到的现象很像:LLMs 没有简单把词拆成 morpheme 拼接 ,而是靠"看到类似单词→ 推断规律→ 应用于新词"。(Dmort27)

4. 构式形态学跟传统形态学比起来有什么不同?

传统形态学 构式形态学
词 = morphemes 的串接 词是 form+meaning 的构式
规则是硬性的 规则是许可性的(licensed)
拼接看重形式 更强调形式与意义的对应

换句话说 (Dmort27):

  • 构式形态学 更像认知和使用导向
  • 不再是字面分解,而是理解模式与归纳规则
  • 更贴近现代 NLP 和 LLM 学到的"类比"机制显现的规律性

小结

  1. 构式形态学不是把词拆得更细,而是理解词怎么构造、它的意义怎么对应。
  2. Rules of Realization 是"给出某种 abstract meaning → 生成具体词"。
  3. Rules of Referral 是"规则之间的桥梁,让一种构式借助另一种构式合理化"。
  4. 它和传统的切割 morphemes 不一样,更像是"模式 + 实例 + 语义对应"。
  5. 这种观点跟我们观察到大型语言模型里 morphology 行为更贴近类比和模式匹配。
相关推荐
装不满的克莱因瓶几秒前
掌握感知器的学习原理
人工智能·python·神经网络·算法·ai·卷积神经网络
卡梅德生物科技小能手5 分钟前
卡美德生物科普:LOXL2(赖氨酰氧化酶样蛋白2)
人工智能·经验分享·生活
Dragon Wu7 分钟前
AI视频创作笔记(五)短剧制作流程
人工智能·ai
一切皆是因缘际会9 分钟前
AI产业的深度变革与未来思辨
人工智能·ai·架构
不爱土豆唯爱马铃薯10 分钟前
MONKEYCODE 教程系列MC-025 | 实战AI客服机器人
人工智能·数据挖掘
keykey6.10 分钟前
用 PyTorch 训练图像分类器:完整实战
开发语言·人工智能·深度学习·机器学习
刘婉晴12 分钟前
【火山「AI安全攻防」】恶意Skill检测引擎设计思路分享
人工智能·安全
小王毕业啦22 分钟前
2009-2024年 各国清廉指数CPI(xlsx)
大数据·人工智能·数据挖掘·数据分析·社科数据·实证分析·经管数据
syounger33 分钟前
从遗留系统到AI运营:富士通转型折射日本企业的数字化再考
人工智能
DogDaoDao44 分钟前
【GitHub】CodeGraph 深度解析:为 AI 编程代理构建预索引代码知识图谱
人工智能·程序员·github·知识图谱·ai编程·ai agent·codegraph