CMU Subword Modeling | 11 Rules of realization and rules of referral

这次课是在讲一种叫 Construction Morphology(构式形态学) 的方法,重点解释了:

  • 规则(Rules of Realization 和 Rules of Referral)在形态学中的角色
  • 构式形态学如何用"模式(schema)"组织词和意义的关系
  • 它跟传统的词与形态划分(如单纯把词切成 morpheme)有什么不同 (Dmort27)

1. 什么是 Construction Morphology(构式形态学)

想象你学乐高:

  • 传统的形态学可能会把一个词看成一堆 Lego 砖块(morphemes)拼起来;
  • 构式形态学则像看 "模块化的 Lego 模式(schema)" :不是强制把每个词分成小块,而是更像:
    • 有些部件组合成了一种 结构模式
    • 然后这个模式可以在不同词里反复"实例化(instance)"
    • 甚至可以表示语义和形式之间的对应关系(不是只是形式拼接)

2. 关键概念解释

1) Construction(构式)

一个构式是一个 形式(form)+意义(meaning) 的组合:

  • 它可以是具体的单词(例如 dirtbag
  • 也可以是一个更抽象的模式 (比如 "某类词 → 表示某种意思的构造法则")(Dmort27)

"构式就像一个图纸,不是只有形状,也有它的意思。"

2) Rules of Realization(实现规则)

这类规则是告诉我们:当你有某种抽象意义 + 形式结构时 → 具体的词是怎么生成的?

比如:[[x]Ni[bag]]N ↔ unpleasant person who is a metaphorical container for SEMi

这个公式的意思是:

  • 左边是形式结构:一个词根 + bag
  • 右边是对应的意思:表示某种不愉快的人
  • ↔ 表示 形式与意思之间的一一对应关系 (realization)(Dmort27)

想象每个词都有一个"造词规则"。

规则里写:"给我一个意思 + 词根,我就能生成相应词。"

所以这是 有意义的组合,不是随意拼接。

3) Rules of Referral(引导规则)

这些规则不是直接 "生成形态",

它们更像是: 把一个构式"链接"到另一个构式 或者 引导去使用另一个更基本的规则

它的作用类似:

"如果你知道 X 怎么组成,那么也可以推出 X 之类似形式 如何理解。"

更学术一点,它不是严格的语法规则,而是一种 许可(licensing)机制

如果某个组合可接受,那另一个基于它的组合也可能是可接受的(但不是强制的)。

这更像是 NLP 里常说的:"模型从数据中归纳出:某种组合是合理的 → 推断其他组合也可能合理"

3. 举个简单的例子

假设有:

  • 规则 A :构造 agent(做某事的人)------例如 walkwalker
  • 规则 B :构造 patient(被动作的人或对象)------例如 walkwalkee

构式形态学会这样定义:

复制代码
[ V do x ] [ N person who does x ]  ↔  Xer  (agent)
[ V do x ] [ N person to whom x is done ]  ↔  Xee  (patient)

这意味着,如果你知道某个动词 "walk",那么你对应有:

  • walker(做 walk 的人)
  • walkee(被 walk 的人 / 事物)

这种方式和我们在某些 NLP 实验中看到的现象很像:LLMs 没有简单把词拆成 morpheme 拼接 ,而是靠"看到类似单词→ 推断规律→ 应用于新词"。(Dmort27)

4. 构式形态学跟传统形态学比起来有什么不同?

传统形态学 构式形态学
词 = morphemes 的串接 词是 form+meaning 的构式
规则是硬性的 规则是许可性的(licensed)
拼接看重形式 更强调形式与意义的对应

换句话说 (Dmort27):

  • 构式形态学 更像认知和使用导向
  • 不再是字面分解,而是理解模式与归纳规则
  • 更贴近现代 NLP 和 LLM 学到的"类比"机制显现的规律性

小结

  1. 构式形态学不是把词拆得更细,而是理解词怎么构造、它的意义怎么对应。
  2. Rules of Realization 是"给出某种 abstract meaning → 生成具体词"。
  3. Rules of Referral 是"规则之间的桥梁,让一种构式借助另一种构式合理化"。
  4. 它和传统的切割 morphemes 不一样,更像是"模式 + 实例 + 语义对应"。
  5. 这种观点跟我们观察到大型语言模型里 morphology 行为更贴近类比和模式匹配。
相关推荐
phoenix@Capricornus1 小时前
初等数学中点到直线的距离
人工智能·算法·机器学习
田里的水稻2 小时前
FA_规划和控制(PC)-快速探索随机树(RRT)
人工智能·算法·数学建模·机器人·自动驾驶
天才在此2 小时前
AI时代:软件工程的诞生与死亡
人工智能·软件工程
tq10862 小时前
幻亦幻,真更真
人工智能
阿杰学AI2 小时前
AI核心知识114—大语言模型之 AI Data Annotator(简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·aigc·ai岗位·ai数据标注师
冬奇Lab2 小时前
一天一个开源项目(第28篇):Graphiti - 为 AI Agent 构建实时知识图谱
人工智能·aigc
liliangcsdn2 小时前
LLM如何让游戏交互或行为变得更有趣
人工智能
Sunhen_Qiletian2 小时前
回归与分类的本质区别
人工智能·python