CMU Subword Modeling | 11 Rules of realization and rules of referral

这次课是在讲一种叫 Construction Morphology（构式形态学） 的方法，重点解释了：

想象你学乐高：

传统的形态学可能会把一个词看成一堆 Lego 砖块（morphemes）拼起来；
构式形态学则像看 "模块化的 Lego 模式（schema）" ：不是强制把每个词分成小块，而是更像：
- 有些部件组合成了一种 结构模式
- 然后这个模式可以在不同词里反复"实例化（instance）"
- 甚至可以表示语义和形式之间的对应关系（不是只是形式拼接）

一个构式是一个 形式（form）+意义（meaning） 的组合：

"构式就像一个图纸，不是只有形状，也有它的意思。"

这类规则是告诉我们：当你有某种抽象意义 + 形式结构时 → 具体的词是怎么生成的？

比如：[[x]Ni[bag]]N ↔ unpleasant person who is a metaphorical container for SEMi

这个公式的意思是：

想象每个词都有一个"造词规则"。

规则里写："给我一个意思 + 词根，我就能生成相应词。"

所以这是 有意义的组合，不是随意拼接。

这些规则不是直接 "生成形态"，

它们更像是： 把一个构式"链接"到另一个构式 或者 引导去使用另一个更基本的规则

它的作用类似：

"如果你知道 X 怎么组成，那么也可以推出 X 之类似形式 如何理解。"

更学术一点，它不是严格的语法规则，而是一种 许可（licensing）机制：

如果某个组合可接受，那另一个基于它的组合也可能是可接受的（但不是强制的）。

这更像是 NLP 里常说的："模型从数据中归纳出：某种组合是合理的 → 推断其他组合也可能合理"

假设有：

构式形态学会这样定义：

复制代码

[ V do x ] [ N person who does x ]  ↔  Xer  (agent)
[ V do x ] [ N person to whom x is done ]  ↔  Xee  (patient)

这意味着，如果你知道某个动词 "walk"，那么你对应有：

这种方式和我们在某些 NLP 实验中看到的现象很像：LLMs 没有简单把词拆成 morpheme 拼接 ，而是靠"看到类似单词→ 推断规律→ 应用于新词"。(Dmort27)

换句话说 (Dmort27)：