01-语言模型+维特比

1. 什么是语言模型?

语言模型的目标是计算一个句子(或一串词序列)出现的概率。比如,判断"我爱你"和"爱我你"哪个更像人话。

  • 核心思想 :利用链式法则,一句话的概率等于每个词在给定前面所有词时出现概率的乘积。
    P(我, 爱, 你) = P(我) × P(爱|我) × P(你|我, 爱)

  • 实际简化(N-gram模型) :计算"条件概率"时,不可能回溯无限长的历史。通常假设一个词只与它前面的 N-1 个词相关。

    • Uni-gram (1-gram) :词与词完全独立。P(我,爱,你) ≈ P(我)P(爱)P(你) (不考虑上下文,效果差)
    • Bi-gram (2-gram) :只与前一个词相关。P(我,爱,你) ≈ P(我)P(爱|我)P(你|爱)
    • Tri-gram (3-gram):与前两个词相关。这是最常用的折中选择。
  • 应用

    • 机器翻译 :译成"苹果很好吃"还是"苹果很吃好"?

2. 维特比算法------经典案例:词性标注

我们有一个隐马尔可夫模型(HMM),它由两部分构成:

  1. 转移概率:一个词性后面跟另一个词性的可能性。这部分由语言模型(通常是Bi-gram)提供。
  2. 发射概率:某个词性"产生"出当前单词的可能性。

任务 :给句子 "我 爱 编程" 标注词性 (我/代词,爱/动词,编程/名词)

  1. 定义状态:词性集合 {代词, 动词, 名词, 形容词...}
  2. 定义观测:单词 {我, 爱, 编程...}
  3. 定义概率
    • 转移概率 (语言模型)P(动词|代词) = 0.4, P(名词|动词) = 0.3...
    • 发射概率P(我|代词) = 0.8, P(爱|动词) = 0.9, P(编程|名词) = 0.7...
  4. 维特比算法执行过程
    • 初始化 (第1个词"我") :计算"我"是各种词性的概率。V(代词) = P(代词) × P(我|代词)。假设"代词"得分最高。
    • 迭代 (第2个词"爱") :对每个可能的当前词性(如"动词"),计算:
      上一最佳路径概率 × P(当前词性|上一词性) × P(爱|当前词性)
      关键 :假设上一词性是"代词"时分数最高,那么到达"动词"的最佳路径就是 ...代词→动词。其他如...名词→动词的路径就被丢弃。
    • 终止:处理完最后一个词后,回溯,得到整条最优路径:代词 → 动词 → 名词。

如果没有维特比 :枚举 代词/动词/名词代词/名词/动词... 共27种,手工可行,但真实情况有上百种词性,句子有20个词时,组合数远超宇宙原子数。

有了维特比:每次只保留N条候选路径(N=词性个数),计算量线性增长,秒出结果。

总结与核心要点

概念 角色定位 解决的问题 输出
语言模型 定义"什么是合理的序列" (提供打分标准 计算某条路径(词序列、词性序列)的合理程度。即 P(序列) 一个概率分数
维特比算法 寻找"得分最高的序列" (提供搜索方法 在指数级爆炸的可能性中,高效找到全局最优路径。 最优的隐藏状态序列
相关推荐
冬奇Lab7 分钟前
RAG 系列(十六):Graph RAG——用知识图谱解决多跳关系问题
人工智能·llm
冬奇Lab16 分钟前
一天一个开源项目(第101篇):OpenHuman - 真正懂你的本地优先个人 AI 超级助手
人工智能·开源·资讯
云上码厂24 分钟前
专业的学术会议 / 讲座视频与幻灯片托管、回放平台(可以使用SlidesLive 学英语入门清单)
人工智能
无心水29 分钟前
【Hermes:安全、权限与生产环境】40、运行 Hermes 前的生命线:安全审计清单与 11 个必须检查的配置项
人工智能·安全·mcp协议·openclaw·养龙虾·hermes·honcho
温九味闻醉41 分钟前
关于腾讯广告算法大赛2025项目分析3-重读
人工智能·机器学习
十铭忘1 小时前
AI画架构图的方法
人工智能
chatexcel1 小时前
AI知识库教程:基于ChatExcel实现规则文档、Excel数据与业务分析联动
人工智能·excel
Hali_Botebie1 小时前
【图卷积网络】GCN是AXΘ 和CNN是AX
网络·人工智能·cnn
还在忙碌的吴小二1 小时前
今日AI行业热点新闻
人工智能
Bode_20021 小时前
AIoT 技术难点
人工智能·制造