摘要:西方形态中心主义与实体中心主义语言学在汉语研究中长期存在削足适履的理论困境,无法合理解释汉语"重语义、轻文法"的核心特征、文言文的词类活用现象及"谓词---论元"结构的本质。本文以"指称---陈述"二元对立与互补为核心形式语义学框架,构建了涵盖语言起源、语义本质、汉语特征与哲学基础的统一解释体系。研究表明:"指称---陈述"的最初分化是人类语言诞生的根本标志;其二元互补是完整句义的充要条件,其本体论根基为客观世界"存在---运动"的二元基本结构;语义的核心是陈述而非指称,实体的本质内涵是其全部行为与属性特征的总和,指称仅为内容的形式载体;汉语尤其是文言文保留了人类语言初期"指称---陈述"未完全固化的原生形态,实现了表达形式、思维形式与逻辑形式的三位一体;该体系与章太炎"实---德---业"三位一体的传统哲学认知范式深度契合,从根本上纠正了西方语言学将逻辑等同于意义本体、将实体等同于语义中心的双重理论误区。本研究为汉语语义学提供了本土化的理论基础,也为汉语自然语言处理的底层架构设计提供了新的思路。
关键词:#指称陈述#形式语义学#谓词中心论#实德业#自然语言处理#语义消歧
一、引言
自"现代语言学"传入中国以来,汉语研究长期受制于印欧语系的"形态语法框架"与"实体中心主义"哲学传统。西方语言学以"词性形态变化"为核心的分类体系,在解释汉语词类模糊、词类活用、语义优先等现象时屡屡陷入矛盾;其将"实体指称"视为语义核心的传统,更是无法解释"谓词---论元"结构的普遍规律与汉语语义生成的内在机制。事实上,语言的核心是"语义"而非形态,语义的核心是"内容"而非载体,不同语言的形态差异只是语义结构在不同演化路径下的外在表现。
近年来,随着汉语自然语言处理(NLP)研究的深入,西方基于"形式逻辑"与"实体中心的语义理论"在处理中文复杂语义、歧义消解、上下文理解等方面的局限性日益凸显。构建符合汉语自身认知规律的本土语义学体系,已成为语言学与人工智能领域的迫切需求。本文基于**郑捷《NLP汉语自然语言处理原理与实践》**中的核心观点,以"指称---陈述"二元互补为底层逻辑,打通本体论、认识论、逻辑学与语言学的学科壁垒,系统阐释汉语语义的生成机制与本质特征,重点论证"陈述为语义中心、指称为形式载体"的核心命题,并追溯其与中国传统哲学的内在关联,旨在建立一套自洽且具有解释力的汉语形式语义学理论。
二、语言起源:"指称---陈述"分化作为语言诞生的本体论标志
人类语言与动物本能信号的本质区别,不在于符号系统的复杂度,而在于认知层面实现了"指称"与"陈述"的功能性分化。
发展语言学的研究表明,人类语言的萌芽始于"双词句阶段",这并非两个词汇的简单叠加,而是人类认知首次实现"指称"与"陈述"的功能性分离与组合,是人类认知能力的一次革命性跃迁。
①"指称"维度对应对事物"存在"属性的表征,是对世界实体的"本体性"标定,其演化产物为"名词"范畴,承担标识客观"实体"、确立言说对象的功能。
②"陈述"维度对应对事物"运动/属性"的表征,是对实体变化、状态与特征的描述,其演化产物为"动词"与"形容词"范畴,承担刻画客观"实体"存在方式的功能。
在"指称---陈述"实现功能性分化之前,人类的发声符号与动物的本能信号并无本质差异,只能传递单一的情绪宣泄或孤立的事物指代,无法构成完整的语义单元。只有当人类能够将一个实体(指称)与该实体的存在方式(陈述)分离并重新组合时,符号系统才具备了传递完整信息的能力。这一分化过程同步催生了最原始的语法规则,使名词、动词与语法三者得以同步诞生,最终实现了从动物信号到人类语言的质变。
三、语义本质:"指称---陈述"二元互补与谓词中心论
3.1信息的本体论基础
"语言"作为信息编码系统,其语义结构本质上是对客观世界结构的映射。现代物理学与哲学研究表明,世界的本质可归结为"存在(质量)"与"运动(能量)"的对立统一:
①质量的本质是存在,表现为相对稳定的物质结构,空间是存在的测度;
②能量的本质是运动,表现为物质状态的变化,时间是运动的度量。
纯粹的无属性实体与无载体的悬空运动均无法独立存在,世间万物始终在静态存在与动态运动之间保持平衡。"信息"的本质既非物质也非能量,而是事物之间的联系,是对事物"存在方式或运动状态"的表征(钟义信,1996)。任何完整的信息都必须同时包含"存在"与"运动"两个维度,缺一不可。这一客观规律决定了语言作为信息编码系统的基本结构。
3.2完整句义的二元结构与谓词中心论
单个词汇只能表征事物的单一属性:
①要么是指称性的"存在";
②要么是陈述性的"运动/属性"。
都无法传递完整信息。
①孤立的名词只能标识一个实体,无法说明该实体的任何状态;
②孤立的动词只能描述一种动作,无法说明动作的实施者;
③孤立的形容词只能描述一种属性,无法说明属性的实施者。
只有通过"名词(指称)+动词/形容词(陈述)"的二元互补结构,才能同时编码实体及其存在方式,构成完整的语义单元。
这正是"句子是语言基本单位"的根本原因,也是SV(主谓)结构成为人类所有语言原始句式的底层逻辑。
语言的演化过程本质上是"指称---陈述"分化程度不断提高的过程:
①从人类最初的SV原始句式,逐步演化出成熟的SVO(主谓宾)句法模式;
②西方语言(如英语)通过词尾变化、时态标记等形态手段,使得名词、动词、形容词的形态分化程度更高;
③而汉语则保留了更多原始语言的特征,词性未完全固定,需依赖语境进行语义判断。
3.2.1实体本质与语义中心的转移
本理论最核心的突破之一,是彻底颠覆了西方语言学的"实体中心论",确立了陈述(谓词)在语义结构中的核心地位,其逻辑链条如下:
1.实体的本质是内容而非形式:实体的本质内涵并非其自身(本体)的质料性存在,而是其全部可观测行为特征与固有属性特征的总和。以"苹果"这一指称实体为例,人类对其的认知并非源于其物理质料本身,而是源于其全部可观测属性与行为特征的集合:可食用、具有特定口感与形态、能够生长结果、可被加工为食品等。正是这些陈述性内容,构成了"苹果"这一指称符号的全部语义内涵;脱离这些内容,指称将沦为无意义的空符号。人类对任何实体的认知、评价与判断,均建立在对其行为与属性特征的认知基础之上。
2.指称是内容的形式载体:指称性的名词只是实体的符号外壳,是承载行为与属性特征的外延形式。一个具体的指称实体,本质上都是一组特定行为与属性特征集合的外在表征。
3.陈述是语义的核心内容:陈述性的谓词(动词、形容词)直接对应实体的行为与属性,是语义的实质内容。有什么样的陈述,人们就会把什么样的行为或属性映射 在对应的指称实体上;所有具体指称实体的总和,构成了某一行为或属性特征的外延。
基于上述逻辑,"指称---陈述"二元结构的深层对应关系可明确为:
①指称→实体→形式载体→体词(论元、名词(实))
②陈述→行为/属性→核心内容→谓词(动词(业)、形容词(德))
这一对应关系从根本上解释了"谓词---论元"结构的普遍必然性:"谓词"之所以是句子的语义中心,能够支配多个"论元(指称实体)",并非语法规则的人为规定,而是因为谓词对应语义的核心内容------"实体的行为与属性"。"论元"只是谓词所表达的内容所涉及的参与者,是内容的载体而非内容本身。
3.3二元互补结构的跨学科普遍性
"指称---陈述"并非孤立的语言学概念,而是贯穿自然科学与人文社会科学的普遍底层结构。
|---------------|-----------------------------------------------|----------------------------------------------------------------|
| 学科领域 | 指称维度 | 陈述维度 |
| 物理学 | 物质、存在、静态、空间 | 能量、运动、动态、时间 |
| 哲学 | 形式、本体 | 内容、属性 |
| 系统科学 | 结构 | 组分(元素) |
| 信息科学 | 信息的物质载体 | 信息的内容 |
| 逻辑学 | 主词(逻辑层面---逻辑主项) 外延 | 谓词(逻辑层面---逻辑谓项) 内涵 |
| 普通语言学 | 能指(语音、语汇(词汇)、语法) | 所指(语义) |
| 语法语义学 | 体词(名词(实 )、代词、数词、量词)、 论元 主词(句法层面---主语) | 谓词(动词(业 )、形容词(德 )) 谓词("谓词---论元") 谓词(句法层面---谓语) |
| 计算语义学 | 实体 | 行为(关系)、属性(属性值、特征) |
| 形式语义学 | 指称(形式载体) | 陈述(核心内容) |
从物理学到计算机科学,整个世界的底层逻辑,都可以用"指称---陈述"这对二元结构来解释。这不是人为规定的规则,而是客观世界的本质映射:
·物质是物理现象的基础载体(指称对象),而能量、运动、时间是描述物质的物理量/状态(陈述性属性),符合物理学的基础逻辑。
·本体/形式是哲学讨论的核心对象(指称),内容、属性是对本体的规定性描述(陈述),匹配传统哲学"本体---属性"的二元结构。
·结构(系统的组织形式)作为指称对象,组分(系统的构成元素)作为对系统的内容性描述,符合"形式---内容"的二元逻辑。系统科学中,结构与组分是辩证统一的,二者共同构成系统的"形式---内容"二元关系。
·载体是信息的物理形式(指称),内容是信息的意义核心(陈述),是信息科学的经典二元结构。
·主项/外延是被断定的对象(指称),谓项/内涵是对主项的断定(陈述),是形式逻辑的基础结构。
·语言的形式层面(语音/语汇(词汇)/语法)是能指(指称),语义内容是所指(陈述),是语言学的基础二元结构。
·主语/体词/论元是句子中的指称性成分(被描述的对象),谓语/谓词是陈述性成分(对对象的描述)。
·实体是语义处理的核心对象(指称),行为(关系)/属性(属性值、特征)是对实体的描述(陈述),匹配三元组的基础结构。
3.4对西方语言学双重核心误区的纠正
本理论从两个层面突破西方形态语言背景下生成的语言学框架适配汉语时的理论局限:
1.纠正"逻辑等同于意义本体"的错误: "逻辑语义学"负责对"陈述"部分进行"形式逻辑"的真值、推理与判断,它是服务于语义表达的工具,而非意义本身。意义的本体是纯语义内容;而"指称---陈述"的二元互补结构,是纯语义内容得以显现、表达和传递的存在方式,是形式与内容的统一体。"逻辑语义学"定义的"逻辑"只是附着在"陈述"之上的派生功能,既不是意义的本体,也不是意义的表达方式。
补充说明:
①西方语言学的误区,就在于混淆了这三个层次:要么把指称的形式(语音、语法)当成意义本体(结构主义),要么把陈述的工具(形式逻辑)当成意义本体(逻辑语义学),唯独跳过了最核心的"纯语义内容本体"。
②更进一步而言,西方"逻辑语义学"的错误,在于混淆了"描述语义的工具逻辑"与"语义本身的内容逻辑":它将人为规定的数理形式逻辑(二值真值、谓词演算、非黑即白的逻辑门规则),套用于人类语义与认知的研究,把"工具的规则"当成了研究对象"本身的内在规律"。"数理形式逻辑"是服务于"确定性"问题的形式化工具,其核心是"非真即假"的二值判断,不存在中间过渡地带,不依赖语境,也不承认程度差异;但人类的语义与认知本质上遵循"语义内容逻辑":它既非二值判断,也非无限渐变的模糊连续统,而是采用有限离散语义分级的方式,存在清晰的程度边界、可量化的语义强度与动态语境依赖,其推理是"或然性"的路径选择,而"非必然性"的形式推演。将"数理形式逻辑"作为语义研究的核心框架,本质上是"用尺子量温度"的范畴错误,这也是西方语言学无法解决模糊语义、转喻隐喻、语境依赖等核心问题,最终走向黑箱统计拟合路线的根源。本理论摒弃了用"数理形式逻辑"硬套语义的错误路径,回归纯语义内容本身的内在规律,构建真正符合人类认知机制的语义内容逻辑体系。
2.纠正"实体等同于语义中心"的错误:西方语言学受亚里士多德"实体本体论"影响,长期将指称性的实体视为语义的核心。而本理论证明,实体只是语义内容的形式载体,陈述性的行为与属性才是语义的核心。这一纠正不仅解释了"谓词---论元"结构的本质,也为理解汉语词类活用等现象提供了关键钥匙。
四、汉语语义的原生性特征:文言文的三位一体一致性
汉语尤其是文言文的核心特征,是保留了人类语言初期"指称---陈述"未完全固化的原生形态。文言文的简练并非单纯的行文修饰,而是其语义结构本质的体现,即表达形式(指称---陈述)、思维形式(本体---属性)与逻辑形式(主词---谓词)的高度一致性。
4.1表达形式层面:指称与陈述的灵活转换
在文言文中,"指称"与"陈述"的边界并非刚性固定,而是可以根据语义需求自由转换。这种转换本质上是"形式载体"与"核心内容"的相互转化,符合"内容决定形式"的语义规律:
·指称转陈述(形式转内容):当一个实体的核心行为或属性成为语义焦点时,承载该实体的指称名词可直接用作谓词。例如:
①《聊斋志异・狼》中"一狼洞其中"的"洞",其核心语义为"打洞"这一行为,而"洞"作为实体本身正是该行为的典型载体,因此可直接由名词活用为动词;
②《史记・项羽本纪》中"纵江东父老怜而王我"的"王",核心语义为"使......称王"这一行为,"王"是该行为的结果载体。
·陈述转指称(内容转形式):当一个行为或属性成为被指称的对象时,表达该内容的谓词可直接用作体词。例如:
①《史记・项羽本纪》中"将军身披坚执锐"的"坚""锐",核心语义为"坚硬的铠甲""锐利的兵器",此处直接用属性形容词指代具有该属性的实体;
②《论语・述而》中"子钓而不纲,弋不射宿"的"宿",核心语义为"歇宿的鸟",直接用行为动词指代具有该行为特征的实体。
指称与陈述的灵活转换并非文言文所独有,而是贯穿于汉语发展的全过程,在现代汉语中仍有大量体现。例如:
①"百度一下"将专有名词"百度"直接用作动词表示"搜索",
②"很青春"将名词"青春"直接用作形容词表示"年轻有活力"。
此类现象在形态高度固化的印欧语中极为罕见,却在汉语中自然存在,这正是汉语"语义优先于形式"核心特征的体现。
现代语法所称的"词类活用"现象,本质上并非语法规则的例外,而是原始语义结构的自然体现。它充分证明了汉语"重语义、轻文法"的核心属性:当内容需要时,形式可以灵活调整,无需额外的形态标记作为中介。
4.2思维与逻辑层面的三重同构
文言文的语义结构与人类原始思维及形式逻辑的基本结构同构:
①在思维形式层面,对应"本体---属性"的二元认知结构,语言直接映射思维过程;
②在逻辑形式层面,对应"主词---谓词"的基本判断结构,句子的语义结构即逻辑判断结构。
这种三重同构使得文言文的表达具有极强的直观性与整体性,避免了过度"语法化"带来的语义损耗。与西方语言相比,汉语没有经历严格的形态分化过程,反而保留了人类认知最本真、最灵活的状态,这并非语言发展的落后,而是语义结构演化的另一种独立路径。
五、哲学呼应:与章太炎"实---德---业"三位一体的内在统一
"指称---陈述"二元互补体系并非单纯的语言学理论,其深层认知根源与中国传统哲学一脉相承,其中与章太炎先生提出的"实---德---业"三位一体思想的契合度最高,且在"内容中心论"层面形成了深度呼应。这一思想并非章太炎个人独创,而是中国传统哲学的普遍共识,与《墨子》的"名、辞、说"、荀子的"名实之辨"一脉相承,是中国本土认知范式的典型体现。
章太炎立足儒道诸子与佛家唯识思想,将宇宙万物的存在形态概括为"实、德、业"三个不可分割的组成部分:
①实:指客观实体、本体存在,是一切属性与功用的载体,直接对应本理论的"指称"范畴,属于形式载体层面;
②德:指实体的固有属性、本质特征,对应本理论的"属性类陈述",属于核心内容层面之一;
③业:指实体的运动、作用与因果施设,对应本理论的"动作类陈述",属于核心内容层面之一。
章太炎主张"实---德---业"三位一体,认为实体、属性与功用不可分割,且德与业是实的本质规定:没有无德无业的实,也没有无实的德业。这与本理论"实体的本质是其全部行为与属性的总和,指称是内容的形式载体"的核心命题完全一致。中国传统哲学从本体论层面确立了"德业为体、实为用"的内容中心论,而"指称---陈述"二元互补体系则从语言学层面将其转化为可操作的形式规则,最终实现了哲学范畴、思维逻辑与语言表达的深层同构。
六、理论价值与应用展望
6.1语言学理论价值
本研究构建的"指称---陈述"二元互补体系,突破了西方"形态中心主义"与"实体中心主义"语言学的双重理论局限,为汉语研究提供了本土化的解释框架。它不仅能够合理解释汉语词类模糊、词类活用、语义优先等长期争议的问题,还重新定义了语言的本质、语义的生成机制与语义中心的归属,为普通语言学理论的发展提供了来自非形态语言的新视角。
6.2自然语言处理应用价值
当前汉语自然语言处理技术主要基于西方的统计模型与形式逻辑框架,在处理中文复杂语义、歧义消解、上下文理解等方面存在先天不足。"指称---陈述"二元互补体系为汉语NLP的底层架构设计提供了新的思路:计算语义学中的"实体---行为/属性"结构,本质上就是"指称---陈述"二元结构的工程实现。基于"谓词中心论"构建的语义模型,能够更贴合汉语的认知规律,显著提升中文语义理解的准确性与鲁棒性。
以歧义消解任务为例,当前主流大模型处理"我要晒被子"这类歧义句时,主要依赖大规模语料的统计拟合进行语义推断,易混淆"施事主动晾晒被子"与"获取被晾晒后的被子"两种语义。而基于"指称---陈述"二元互补框架,可直接以谓词"晒"为语义核心,通过论元的语义角色进行判定:当施事论元为具有主观能动性的人时,对应"主动晾晒"语义;当受事论元为核心话题时,对应"被晾晒"语义。该方法无需依赖大规模语料统计,即可实现歧义的精准消解,语义理解的鲁棒性显著优于纯统计模型。
七、结论
"指称---陈述"二元互补不仅是语言起源的根本标志和完整句义的充要条件,更是理解汉语尤其是文言文核心特征的钥匙。该体系以客观世界"存在---运动"的二元结构为本体论根基,确立了"陈述为语义中心、指称为形式载体"的核心命题,从根本上解释了"谓词---论元"结构的普遍必然性,纠正了西方语言学将逻辑等同于意义本体、将实体等同于语义中心的双重理论误区。
汉语保留了人类语言初期"指称---陈述"未完全固化的原生形态,这种独特的语义结构并非劣势,而是汉语的核心优势所在。深入挖掘"指称---陈述"二元互补体系的理论内涵,不仅能够推动汉语语言学的本土化发展,还将为汉语自然语言处理技术的突破提供坚实的理论基础,最终实现中国语言学与人工智能领域的自主创新。
参考文献
1\]郑捷.NLP汉语自然语言处理原理与实践\[M\].北京:电子工业出版社,2017. \[2\]钟义信.信息科学原理\[M\].北京:北京邮电大学出版社,1996. \[3\]章太炎.国故论衡\[M\].上海:上海古籍出版社,2003. \[4\]王寅.认知语言学\[M\].上海:上海外语教育出版社,2007. \[5\]黄易青.上古汉语同源词义系统研究\[M\].北京:商务印书馆,2010.
