九、ELMo 语言模型

ELMo(Embeddings from Language Models)兼顾了两个问题:一是词语用法在语义和语法上的复杂特点;二是随着语言环境的改变,这些用法也应该随之改变,解决多义词的问题。

ELMo 语言模型原理图:

ELMo 模型原理图中虚线的部分是两个双层的 LSTM 网络结构。

  • 左侧的是一个从左到右顺序的正向的双层LSTM 网络,主要用来理解预测词的上文 Context-before。
  • 右侧是一个从右到左逆序的逆向的双层 LSTM 网络结构,主要用来理解预测词的下文 Context-after。

也就是说ELMo 会同时考虑上文和下文。

参考ELMo模型概述

相关推荐
超龄超能程序猿21 分钟前
Spring AI Alibaba 与 Ollama对话历史的持久化
java·人工智能·spring
孤狼灬笑40 分钟前
机器学习四范式(有监督、无监督、强化学习、半监督学习)
人工智能·强化学习·无监督学习·半监督学习·有监督学习
第七序章41 分钟前
【C++】AVL树的平衡机制与实现详解(附思维导图)
c语言·c++·人工智能·机器学习
晨非辰1 小时前
【面试高频数据结构(四)】--《从单链到双链的进阶,读懂“双向奔赴”的算法之美与效率权衡》
java·数据结构·c++·人工智能·算法·机器学习·面试
阿里云大数据AI技术1 小时前
云栖实录 | 通义实验室基于MaxCompute进行大模型数据管理及处理
大数据·人工智能
玉树临风江流儿1 小时前
关于pkg-config的使用示例--g++编译过程引入第三方库(如Opencv、Qt)
人工智能·opencv
struggle20251 小时前
AxonHub 开源程序是一个现代 AI 网关系统,提供统一的 OpenAI、Anthropic 和 AI SDK 兼容 API
css·人工智能·typescript·go·shell·powershell
后端小肥肠1 小时前
公众号对标账号文章总错过?用 WeWe-RSS+ n8n,对标文章定时到你的邮箱(下篇教程)
人工智能·agent
Gloria_niki1 小时前
目标检测学习总结
人工智能·计算机视觉·目标跟踪