增强的依赖性
原文参见 universaldependencies.org/u/overview/...
受控/提升主语
- 受控主语:表示主语由控制动词决定。
- 提升主语:表示主语通过提升动词从嵌套句提升到主句。
基本树缺少受控动词 与其控制者之间 的主语依存关系,也缺少嵌入动词与其升起主语之间的主语依存关系。在增强图中,嵌入动词和矩阵分句的主语之间有额外的从属关系。这种依存关系可以通过扩展名(子类型) :xsubj
来识别。
句子1:Mary wants to buy a book.
考虑句子:"Mary wants to buy a book." 在这个句子中:
- "wants" 是控制动词。
- "to buy" 是受控动词。
- 虽然"to buy"在表面上看没有主语,但从语义上讲,其主语应是"Mary",这是通过控制关系隐含的。
在基本的依存图中,"to buy"可能只通过 xcomp
连接到"wants"。然而,在增强的依存图中,会有一个额外的 nsubj:xsubj
依存关系,直接将"to buy"与"Mary"连接,显示"Mary"是"to buy"动作的执行者,即使这在表面结构中并未明确表达出来。
句子2:She seems to be reading a book.
基本依存树(图25) :
- 主语:She(nsubj) -> seems
- 控制动词:seems
- 动词短语(受控) :to be reading(xcomp) -> seems
- 动词:reading(aux) -> be
- 宾语:a book(obj) -> reading
在基本依存树中,"reading"的主语(She)没有明确表示。
增强依存树(图26) :
- 主语:She(nsubj) -> seems
- 控制动词:seems
- 动词短语(受控) :to be reading(xcomp) -> seems
- 动词:reading(aux) -> be
- 宾语:a book(obj) -> reading
- 增强关系:She(nsubj:xsubj) -> reading
在增强依存树中,增加了 nsubj:xsubj
依存关系,明确指出 "reading"的主语是 "She"。
句子3:Mary made me buy the house.
基本依存树(图27) :
- 主语:Mary(nsubj) -> made
- 控制动词:made
- 宾语:me(obj) -> made
- 动词短语(受控) :buy(xcomp) -> made
- 宾语:the house(obj) -> buy
在基本依存树中,"buy"的主语(me)没有明确表示。
增强依存树(图28) :
- 主语:Mary(nsubj) -> made
- 控制动词:made
- 宾语:me(obj) -> made
- 动词短语(受控) :buy(xcomp) -> made
- 宾语:the house(obj) -> buy
- 增强关系:me(nsubj:xsubj) -> buy
在增强依存树中,增加了 nsubj:xsubj
依存关系,明确指出 "buy"的主语是 "me"。
句子4:Mary wants me to be promoted.
基本依存树(图29) :
- 主语:Mary(nsubj) -> wants
- 控制动词:wants
- 宾语:me(obj) -> wants
- 动词短语(受控) :to be promoted(xcomp) -> wants
- 动词:promoted(aux:pass) -> be
在基本依存树中,"promoted"的主语(me)没有明确表示。
增强依存树(图30) :
- 主语:Mary(nsubj) -> wants
- 控制动词:wants
- 宾语:me(obj) -> wants
- 动词短语(受控) :to be promoted(xcomp) -> wants
- 动词:promoted(aux:pass) -> be
- 增强关系:me(nsubj:xsubj) -> promoted
在增强依存树中,增加了 nsubj:xsubj
依存关系,明确指出 "promoted"的主语是 "me"。
总结
通过在增强依存树中增加 nsubj:xsubj
关系,我们可以更加清晰地表示句子中的控制结构。这种方式确保了嵌入动词的主语明确显示,即使在基本依存树中这种关系是隐含的。这种增强的表示法对于处理复杂句子和自然语言处理应用非常有用,因为它提供了更精确的句法和语义信息。
关系从句(Relative Clauses)解释
obj 是宾语,nsubj 是主语
基本表示法
在基本依存树中,关系代词通常与主句的主谓语(谓词)相连,通常以 nsubj
或 obj
关系表示。
增强表示法
在增强的依存树中,关系代词通过 ref
关系连接到它的先行词(antecedent),而先行词则作为基本树中关系代词的父节点的从属节点连接。
副词相对修饰语也受到同样的对待。
介词短语和副词作定语 (详细参见 张道真的定语)
增强关系包括深层句法关系 (X)
因此,在案例标记语言中,增强的从属关系可能会将动词从属关系连接起来,而这些动词从属关系并不在表面句法所要求的预期形态情况下。
在下面的捷克语例句中,相对修饰短语 v němž "在其中 "必须使用定位格形式 ( Case=Loc
)。如果这是一个主句,那么指代词 dům "房子 "也必须是定位格:v domě "房子里"。然而,这里是名词性从句( Case=Nom
),而且根据该语言的形态-句法规则,强化从句 obl
转为名词性从句是我们意想不到的。
相对要素并不总是直接取决于相对分句的谓语。它可以嵌入得更深,如下面的例子。
如果相对从句有一个名词性谓语,则相对代词可以占据从句的首部位置。
与大多数相对分句不同的是,在这里,基本树中相对代词的父代并不在相对分句中,它的前置词也不会有额外的增强关系将其连接到相对分句中的(不存在的)父代。取而代之的是,我们在相对分句的 nsubj
中从前者添加一个 nsubj
关系(并删除相对代词和主语之间相应的 nsubj
关系)。 acl:relcl
应与基本从句中的关系相同。
Case信息
在非核心隶属关系的关系名中添加介词(或大小写信息),往往可以明确其语义作用。因此,我们用修饰语的大小写信息来增强某些关系标签。被增强的关系是 nmod
、 acl
、 obl
和 advcl
;如果语言合理,一些核心关系也可能被增强: obj
, iobj
, ccomp
。情况信息可以用通过 case
关系附加的副词的词法来表示。对于分句,相应的信息可以用 mark
从属关系的词法来表示。大小写信息也可以用形态特征 Case 的值来表示。在某些语言中,既有状语情况,也有形态情况,它们的组合必须反映在增强关系中。
与此类似,增强型 UD 图也包含 conj
关系,这些关系用它们的协调连词进行了增强。这使得两个短语之间的协调类型更加明确,这对于有多个协调连词的短语尤其有用。
以下是适用的正式规则(摘自本页开头的摘要):
1.以 case
或 mark
或 cc
的形式出现在与父节点的关系被增强的节点上的附加词或连接词。请注意,这是增强关系标签中唯一允许使用非 ASCII 字母的部分。单词应规范化(小写,无错别字),也就是说,一般情况下,我们取其lemma。
原句: The house on the hill
图46:
- the (
det
)修饰 house (NOUN
) - house 是名词(
NOUN
),作为句子的核心 - on (
case
)修饰 hill (NOUN
) - the hill 是介词短语(
nmod:on
),修饰 house
依存关系:
- "the" ->
det
-> "house" - "on" ->
case
-> "hill" - "hill" ->
nmod:on
-> "house"
在这个例子中,介词 "on" 通过 case
依存关系连接到 "hill",表示 "hill" 是介词短语的核心。然后,整个介词短语 "on the hill" 作为名词 "house" 的修饰语,通过 nmod:on
依存关系连接到 "house"。
2.但是,如果大小写/标记相关联的是一个固定的多词表达式,则表达式的词法不一定由各个成员词的词法组成。例如,表示英语表达式 "As Opposed To "的字符串是 as_opposed_to
。
-
规范化形式:
- 确保短语中的每个词都被小写化(除非有特殊规定)。
- 短语中的各个词用下划线连接成一个整体。
-
词法形式(lemma) :
- 对于固定多词表达中的每个词,保持其原有的词法形式,而不是将其转换为基本形式(lemma)。
因为这样将整个短语作为一个整体来看待的动作体现在以上几个方面
3.同样,语法化的非谓语连接词,如 "regard"("关于"),在某些语言中(如果特定语言的准则有要求),尽管被附加为大小写,但仍被标记为 VERB,因此其外延将是动词性的("regard");然而,相应的 deprel 外延应该是语法化的形式,即 "regard"("关于")。
这段话解释了如何处理语法化的非谓语连接词,特别是在某些语言中的处理方式。这些非谓语连接词虽然在某些上下文中表现为介词(或类似于介词),但它们的词性仍保持为动词 ,同时在依存关系标注中,它们的功能标签需要反映其语法化的用途。
例子:regard
-
词汇背景:
- regard 原本是一个动词,意思是"考虑"或"看待"。
- 在某些语境中,regard 演变成了介词或连接词,表示"关于"或"涉及"。
-
在句子中的应用:
-
原句:He spoke regarding the new policy.
- 在这里,regarding 表现为介词,意思是"关于"。
- 但是,其基本词性仍然是动词 regard。
-
-
依存关系标注:
- 在依存关系标注中,regarding 尽管在句子中表现为介词,其词性标签仍标记为动词 VERB。
- 然而,依存关系标签(deprel)需要反映其作为语法化形式的功能。即 regarding 表现为介词,其依存关系标签可能会是
case:regarding
或obl:regarding
。
处理步骤
-
保持基本词性:
- regard 作为动词 VERB,尽管在句子中表现为介词。
- 这种处理方式确保了词性的一致性,反映了其原始动词的词性。
-
依存关系标签的语法化形式:
- 当 regarding 用作介词时,其依存关系标签需要反映其实际功能。
- 例如,
case:regarding
表示 regarding 作为一个介词短语的标记;obl:regarding
表示 regarding 引导的介词短语作为句子的状语。
句子解析:He spoke regarding the new policy.
原句:He spoke regarding the new policy.
- He (主语) ->
nsubj
-> spoke(动词谓语) - spoke (动词) ->
obl:regarding
-> regarding(动词表现为介词) - regarding (动词) ->
case
-> policy(名词)
依存关系标注:
- "He" ->
nsubj
-> "spoke" - "spoke" ->
obl:regarding
-> "regarding" - "regarding" ->
case
-> "policy" - "policy" ->
det
-> "the"
在这个句子中,regarding 保持了动词的词性标签,但其依存关系标签反映了其作为介词的功能,标记为 obl:regarding
。
4.特定语言指南还可能规定,某些同义词(如 "朝 "和 "向")尽管词性不同,但应映射到同一个增强标签上。我们使用下划线字符("_")来连接成员词。
这段话解释了在某些语言的自然语言处理(NLP)和依存关系解析中,如何处理同义词的映射问题。尽管这些同义词可能具有不同的词性或形态特征,为了保持一致性和准确性,特定语言的指南可能会规定将这些同义词映射到同一个增强标签上。
5.如果一个节点有多个情况标记,而这些情况标记没有注释为固定表达式,例如 "停业 "的 out_of
,也可以采用同样的方法。
增强依存树的特点在于,尽管 "out of" 是一个组合的情况标记短语,但每个部分("out" 和 "of")都会分别被标注和处理。这种表示法使得依存关系更加清晰和明确。
6.如果语言中的状语从现有的词形变化中选择一个子集 ,而且同一个状语在不同的词形变化中可能有不同的意义,那么这种方法就特别有用。可能会出现这样的情况:两个介词是协调的,每个介词都选择了不同的词形变化情况,而名词只能满足其中一种情况的要求。例如,[cs] Lidé se rozutekli před a během útoku。"人们在袭击前和袭击中逃跑了"。第一个介词需要动名词,第二个介词需要属格,名词用属格。然而,增强图中的关系应为 obl:před:ins
和 obl:během:gen
。尽管当前句子中名词的表面形式不是语气词,其形态特征是 Case=Gen
,但第一个关系应表示语气词。 obl:před:gen
在语言中不存在,也没有意义。(但是请注意,这个介词并不是只有工具型,指称型也是可能的,而且 obl:před:acc
和 obl:před:ins
的意思也不一样)。