语言是人类最重要的交流工具,而语言理解与生成技术是人工智能研究的重要领域。从写作到对话,再到其他语言任务,都需要对语言进行理解。本节将带你探索人类语言的秘密,并解析大语言模型对语言的强大理解能力。
人类语言的规则系统
人类语言是一种特殊的符号系统,每一个通顺的句子都必须遵循特定的语法和语义规则。例如,在汉语中,动词后通常接宾语,主语一般位于宾语之前。这些规则赋予了我们遣词造句时的规律性,使句子在语法上合乎逻辑。如果机器能够掌握这些规律,它就有可能像人一样造出合理的句子。
那么,如何让机器掌握语言的规律性呢?早期研究主要采用"规则法",即将语言学家总结出的语法规则教给机器,类似于教小学生学习语法。图 31.1展示了一个简单的语法规则,依据这一规则可以生成符合语法的句子,如"猴子拿香蕉"和"猴子吃苹果"。然而,这种方法存在显著局限性,它既难以生成复杂的句子,也无法确保语义的合理性。例如,基于相同的语法规则,机器可能生成不合常理的句子,如"香蕉拿猴子"。
事实上,日常生活中的许多句子并不严格符合固定的语法规则。语言在实际使用中具有灵活性和动态性,人们经常突破传统语法的限制。例如,老朋友见面,可能说:"咖啡了没?"意思是问对方是否喝了咖啡,但这句话本身不符合语法规则。总而言之,一个固化的语法规则无法描述生动、丰富、变动的语言。

语法规则示意图