CMU Subword Modeling | 11 Rules of realization and rules of referral

这次课是在讲一种叫 Construction Morphology(构式形态学) 的方法,重点解释了:

  • 规则(Rules of Realization 和 Rules of Referral)在形态学中的角色
  • 构式形态学如何用"模式(schema)"组织词和意义的关系
  • 它跟传统的词与形态划分(如单纯把词切成 morpheme)有什么不同 (Dmort27)

1. 什么是 Construction Morphology(构式形态学)

想象你学乐高:

  • 传统的形态学可能会把一个词看成一堆 Lego 砖块(morphemes)拼起来;
  • 构式形态学则像看 "模块化的 Lego 模式(schema)" :不是强制把每个词分成小块,而是更像:
    • 有些部件组合成了一种 结构模式
    • 然后这个模式可以在不同词里反复"实例化(instance)"
    • 甚至可以表示语义和形式之间的对应关系(不是只是形式拼接)

2. 关键概念解释

1) Construction(构式)

一个构式是一个 形式(form)+意义(meaning) 的组合:

  • 它可以是具体的单词(例如 dirtbag
  • 也可以是一个更抽象的模式 (比如 "某类词 → 表示某种意思的构造法则")(Dmort27)

"构式就像一个图纸,不是只有形状,也有它的意思。"

2) Rules of Realization(实现规则)

这类规则是告诉我们:当你有某种抽象意义 + 形式结构时 → 具体的词是怎么生成的?

比如:[[x]Ni[bag]]N ↔ unpleasant person who is a metaphorical container for SEMi

这个公式的意思是:

  • 左边是形式结构:一个词根 + bag
  • 右边是对应的意思:表示某种不愉快的人
  • ↔ 表示 形式与意思之间的一一对应关系 (realization)(Dmort27)

想象每个词都有一个"造词规则"。

规则里写:"给我一个意思 + 词根,我就能生成相应词。"

所以这是 有意义的组合,不是随意拼接。

3) Rules of Referral(引导规则)

这些规则不是直接 "生成形态",

它们更像是: 把一个构式"链接"到另一个构式 或者 引导去使用另一个更基本的规则

它的作用类似:

"如果你知道 X 怎么组成,那么也可以推出 X 之类似形式 如何理解。"

更学术一点,它不是严格的语法规则,而是一种 许可(licensing)机制

如果某个组合可接受,那另一个基于它的组合也可能是可接受的(但不是强制的)。

这更像是 NLP 里常说的:"模型从数据中归纳出:某种组合是合理的 → 推断其他组合也可能合理"

3. 举个简单的例子

假设有:

  • 规则 A :构造 agent(做某事的人)------例如 walkwalker
  • 规则 B :构造 patient(被动作的人或对象)------例如 walkwalkee

构式形态学会这样定义:

复制代码
[ V do x ] [ N person who does x ]  ↔  Xer  (agent)
[ V do x ] [ N person to whom x is done ]  ↔  Xee  (patient)

这意味着,如果你知道某个动词 "walk",那么你对应有:

  • walker(做 walk 的人)
  • walkee(被 walk 的人 / 事物)

这种方式和我们在某些 NLP 实验中看到的现象很像:LLMs 没有简单把词拆成 morpheme 拼接 ,而是靠"看到类似单词→ 推断规律→ 应用于新词"。(Dmort27)

4. 构式形态学跟传统形态学比起来有什么不同?

传统形态学 构式形态学
词 = morphemes 的串接 词是 form+meaning 的构式
规则是硬性的 规则是许可性的(licensed)
拼接看重形式 更强调形式与意义的对应

换句话说 (Dmort27):

  • 构式形态学 更像认知和使用导向
  • 不再是字面分解,而是理解模式与归纳规则
  • 更贴近现代 NLP 和 LLM 学到的"类比"机制显现的规律性

小结

  1. 构式形态学不是把词拆得更细,而是理解词怎么构造、它的意义怎么对应。
  2. Rules of Realization 是"给出某种 abstract meaning → 生成具体词"。
  3. Rules of Referral 是"规则之间的桥梁,让一种构式借助另一种构式合理化"。
  4. 它和传统的切割 morphemes 不一样,更像是"模式 + 实例 + 语义对应"。
  5. 这种观点跟我们观察到大型语言模型里 morphology 行为更贴近类比和模式匹配。
相关推荐
冬奇Lab4 小时前
Workflow 系列(01):基础理论——三种执行模型与 Anthropic 5 种模式
人工智能·agent·工作流引擎
冬奇Lab4 小时前
每日一个开源项目(第143篇):page-agent - 纯 JS 的网页 GUI Agent,无需截图、无需插件、无需后端
前端·人工智能·agent
程序员cxuan6 小时前
虽迟但到!GPT-5.6 终于来了!
人工智能·后端·程序员
ZhengEnCi8 小时前
Q03-UI设计进阶技巧-让界面更高级的7个核心原则
人工智能
IT_陈寒8 小时前
React的这个渲染问题连官方文档都没说清楚
前端·人工智能·后端
不加辣椒9 小时前
第12章 工具调用与 Agent 提示工程
人工智能
用户1693176172669 小时前
前端给AI消息做日期分组与时间线
人工智能
i晟9 小时前
Claude Code Harness 深度拆解:从你敲回车到模型回复,中间发生了什么
人工智能
用户2527362781411 小时前
【踩坑复盘】我在本地跑 RAG 知识库时踩了 5 个大坑,吐血整理避坑指南
人工智能
大模型真好玩11 小时前
LangChain DeepAgents 速通指南(九)—— 生产级智能体框架 DeepAgents Code 源码导读
人工智能·langchain·agent