人工智能应用- 语言理解:02. 语言模型

后来,研究者发现词与词之间的关联更能反映语言的规律。一句话是否合理,往往取决于其中的词语搭配是否常见。例如,"我看电视"是合理的,因为"我"和"看"常常搭配在一起,"看"和"电视"也是自然的组合。而类似于"我吃电视"或"我打电视"这样的表达则不合常理,因为这些搭配在实际语言中几乎不存在。

"常见的搭配就是合理的"是人类语言的一条重要原则,也是人类语言最大的秘密。那么,如何让机器判断一句话是否常见呢?一种常用的方法是统计句子在大规模语料库中出现的频率,称为句子X 的概率,记为 P(X)。概率越高,表示该句子越常见,也越合理。

图给出了一个语料库中统计由"我""、看""、吃""、打""、电视"和"电话"六个词组成句子的概率表。可以看出,越常见的句子概率越高,而不合理的句子概率则较低。我们通常将P(X) 称为语言模型。语言模型本质上通过概率统计来刻画语言的规律。

相关推荐
阳光是sunny16 小时前
别再被 worktree 绕晕了!AI 编程时代你必须掌握的 Git 隔离神器
前端·人工智能·后端
冬奇Lab17 小时前
每日一个开源项目(第148篇):obsidian-skills - Obsidian CEO 亲写的 AI Agent 格式规范,让 Agent 不再破坏你的 Vault
人工智能·开源·资讯
ethantan17 小时前
AI Agent 组成:像人一样思考的智能体
人工智能·程序员·架构
冬奇Lab17 小时前
Workflow 系列(05):评测体系——三层测试结构与 Trace 追踪
人工智能·工作流引擎
ethantan18 小时前
一篇讲解AI Agent 组成:像人一样思考的智能体
人工智能·后端·程序员
Cosolar20 小时前
vLLM 生产级部署完全指南
人工智能·后端·架构
CodePlayer竟然被占用了20 小时前
被美国政府封杀18天,Claude Fable 5 回来了——但代价是什么?
人工智能
IT_陈寒20 小时前
垃圾回收器选错了,我的Java服务内存炸了
前端·人工智能·后端
smartpi21 小时前
SmartPi GPIO 脉冲与回复语执行时序指南
人工智能
阿里云大数据AI技术21 小时前
PAI支持一键部署GLM-5.2,Coding能力比肩Claude Opus 4.8
人工智能