NNLM神经网络语言模型总结

一开始还以为很复杂,总结一下就是:

NNLM 将某个单词前 n−1 个词各自转为 embedding,拼接成一个 (n−1)⋅d 维的向量,再通过隐藏层 + 输出层 + softmax,预测下一个词的概率分布

可以发现,这个2003年提出的模型在架构上和GPT大体是没区别的,都是用之前的文字预测下一个文字;都是用之前文字的embedding经过一个特殊层(前者是FFN,后者是transformer decoder)来得到一个词表向量,根据向量的分量大小选择某个单词。

后话

当然,前者的效果差多啦,也存在不能辨别n-1个token顺序等问题。但是,还是感觉挺神奇的。

相关推荐
GISer_Jing几秒前
AI全栈工程师知识体系全景:从前后端核心架构到落地项目全拆解
前端·人工智能·后端·ai编程
翔云1234562 分钟前
vLLM 全部8种部署方式(按从简单到企业级排序,附适用场景+最简命令)
人工智能·ai·大模型
ShareCreators4 分钟前
AI悖论——热情高涨,价值难彰
人工智能·汽车·blueberry
AI医影跨模态组学4 分钟前
如何将多模态MRI影像特征与脑膜瘤细胞增殖标志物Ki-67建立关联,并进一步解释其与肿瘤生长速率、无进展生存期的机制联系
人工智能·论文·医学·医学影像·影像组学
tiger从容淡定是人生5 分钟前
AI替代软件战略(一):从 CCleaner 到 MCP 架构重构 —— TigerCleaner 的工程实践
人工智能·重构·架构·c#·mcp
做cv的小昊6 分钟前
【TJU】研究生应用统计学课程笔记(6)——第二章 参数估计(2.4 区间估计)
人工智能·笔记·线性代数·算法·机器学习·数学建模·概率论
Carl_奕然8 分钟前
【智能体】Agent的四种设计模式之:ReAct
人工智能·设计模式·语言模型
小白64028 分钟前
AI辅助设计Flutter蓝牙自动连接系统
人工智能·flutter
DeepReinforce10 分钟前
二、AI量化投资:沪市主板A股所有股票20250430到20260430双均线(MA5/MA20)回测结果
人工智能·量化