这次课是在讲一种叫 Construction Morphology(构式形态学) 的方法,重点解释了:
- 规则(Rules of Realization 和 Rules of Referral)在形态学中的角色
- 构式形态学如何用"模式(schema)"组织词和意义的关系
- 它跟传统的词与形态划分(如单纯把词切成 morpheme)有什么不同 (Dmort27)
1. 什么是 Construction Morphology(构式形态学)
想象你学乐高:
- 传统的形态学可能会把一个词看成一堆 Lego 砖块(morphemes)拼起来;
- 构式形态学则像看 "模块化的 Lego 模式(schema)" :不是强制把每个词分成小块,而是更像:
- 有些部件组合成了一种 结构模式
- 然后这个模式可以在不同词里反复"实例化(instance)"
- 甚至可以表示语义和形式之间的对应关系(不是只是形式拼接)
2. 关键概念解释
1) Construction(构式)
一个构式是一个 形式(form)+意义(meaning) 的组合:
- 它可以是具体的单词(例如 dirtbag)
- 也可以是一个更抽象的模式 (比如 "某类词 → 表示某种意思的构造法则")(Dmort27)
"构式就像一个图纸,不是只有形状,也有它的意思。"
2) Rules of Realization(实现规则)
这类规则是告诉我们:当你有某种抽象意义 + 形式结构时 → 具体的词是怎么生成的?
比如:[[x]Ni[bag]]N ↔ unpleasant person who is a metaphorical container for SEMi
这个公式的意思是:
- 左边是形式结构:一个词根 +
bag - 右边是对应的意思:表示某种不愉快的人
- ↔ 表示 形式与意思之间的一一对应关系 (realization)(Dmort27)
想象每个词都有一个"造词规则"。
规则里写:"给我一个意思 + 词根,我就能生成相应词。"
所以这是 有意义的组合,不是随意拼接。
3) Rules of Referral(引导规则)
这些规则不是直接 "生成形态",
它们更像是: 把一个构式"链接"到另一个构式 或者 引导去使用另一个更基本的规则
它的作用类似:
"如果你知道 X 怎么组成,那么也可以推出 X 之类似形式 如何理解。"
更学术一点,它不是严格的语法规则,而是一种 许可(licensing)机制:
如果某个组合可接受,那另一个基于它的组合也可能是可接受的(但不是强制的)。
这更像是 NLP 里常说的:"模型从数据中归纳出:某种组合是合理的 → 推断其他组合也可能合理"
3. 举个简单的例子
假设有:
- 规则 A :构造 agent(做某事的人)------例如 walk → walker
- 规则 B :构造 patient(被动作的人或对象)------例如 walk → walkee
构式形态学会这样定义:
[ V do x ] [ N person who does x ] ↔ Xer (agent)
[ V do x ] [ N person to whom x is done ] ↔ Xee (patient)
这意味着,如果你知道某个动词 "walk",那么你对应有:
- walker(做 walk 的人)
- walkee(被 walk 的人 / 事物)
这种方式和我们在某些 NLP 实验中看到的现象很像:LLMs 没有简单把词拆成 morpheme 拼接 ,而是靠"看到类似单词→ 推断规律→ 应用于新词"。(Dmort27)
4. 构式形态学跟传统形态学比起来有什么不同?
| 传统形态学 | 构式形态学 |
|---|---|
| 词 = morphemes 的串接 | 词是 form+meaning 的构式 |
| 规则是硬性的 | 规则是许可性的(licensed) |
| 拼接看重形式 | 更强调形式与意义的对应 |
换句话说 (Dmort27):
- 构式形态学 更像认知和使用导向
- 不再是字面分解,而是理解模式与归纳规则
- 更贴近现代 NLP 和 LLM 学到的"类比"机制显现的规律性
小结
- 构式形态学不是把词拆得更细,而是理解词怎么构造、它的意义怎么对应。
- Rules of Realization 是"给出某种 abstract meaning → 生成具体词"。
- Rules of Referral 是"规则之间的桥梁,让一种构式借助另一种构式合理化"。
- 它和传统的切割 morphemes 不一样,更像是"模式 + 实例 + 语义对应"。
- 这种观点跟我们观察到大型语言模型里 morphology 行为更贴近类比和模式匹配。