九、ELMo 语言模型

ELMo(Embeddings from Language Models)兼顾了两个问题:一是词语用法在语义和语法上的复杂特点;二是随着语言环境的改变,这些用法也应该随之改变,解决多义词的问题。

ELMo 语言模型原理图:

ELMo 模型原理图中虚线的部分是两个双层的 LSTM 网络结构。

  • 左侧的是一个从左到右顺序的正向的双层LSTM 网络,主要用来理解预测词的上文 Context-before。
  • 右侧是一个从右到左逆序的逆向的双层 LSTM 网络结构,主要用来理解预测词的下文 Context-after。

也就是说ELMo 会同时考虑上文和下文。

参考ELMo模型概述

相关推荐
ywyy679810 分钟前
微小店推客系统开发:构建全民营销矩阵,解锁流量增长密码
人工智能·搜索引擎·微信小程序·系统·短剧·推客系统·微小店
郜太素10 分钟前
深度学习中的正则化方法与卷积神经网络基础
人工智能·pytorch·python·深度学习·神经网络·机器学习·cnn
Him__14 分钟前
AI能源危机:人工智能发展与环境可持续性的矛盾与解决之道
人工智能·ai·chatgpt·aigc·llama
pen-ai15 分钟前
【NLP】34. 数据专题:如何打造高质量训练数据集
人工智能·自然语言处理
蹦蹦跳跳真可爱58920 分钟前
Python----目标检测(labelimg和labelme的安装与使用,Pycharm配置教程)
人工智能·python·目标检测·计算机视觉·pycharm
英码科技21 分钟前
AI筑基,新质跃升|英码科技亮相华为广东新质生产力创新峰会,发布大模型一体机新品,助力产业智能化转型
人工智能·科技·华为
新加坡内哥谈技术30 分钟前
Jules 从私有预览阶段推向全球公测
人工智能·语言模型
范桂飓34 分钟前
GPU 超级节点:AWS Trainium2 UltraServer
人工智能·云计算·aws
m0_5405077842 分钟前
人工智能的“歧视”:“她数据”在算法运行中隐形
人工智能
清醒的兰1 小时前
OpenCV 图像色彩空间转换
人工智能·opencv·计算机视觉