技术栈
Transformer以及BERT阅读参考博文
mumukehao
2025-02-14 13:56
Transformer以及BERT阅读参考博文
Transformer学习:
已有博主的讲解特别好了:
李沐:
Transformer论文逐段精读【论文精读】_哔哩哔哩_bilibili
知乎:
Transformer模型详解(图解最完整版) - 知乎
个人杂想:
Q K T ∗ V QK^{T}*V QKT∗V中, Q K T QK^T QKT其实可以理解为相似性矩阵S,那么 S ∗ V S*V S∗V其实就相当于相似性矩阵对原始的嵌入加权求和。这感觉就是GAT的一个思想源泉。
残差连接和concat挺重要的
BERT
BERT模型架构详解 - 知乎
李沐:
BERT 论文逐段精读【论文精读】_哔哩哔哩_bilibili
文本属性图
上一篇:
时尚搭配助手,深度解析用Keras构建智能穿搭推荐系统
下一篇:
DeepSeek从入门到精通:提示词设计的系统化指南
相关推荐
mumukehao
10 个月前
Pretraining Language Models with Text-Attributed Heterogeneous Graphs
文本属性图
热门推荐
01
GitHub 镜像站点
02
UV安装并设置国内源
03
Linux下V2Ray安装配置指南
04
Open-AutoGLM Windows 安装部署教程
05
【AutoGLM部署】本地私有化部署AI手机Agent
06
在VSCode配置Java开发环境的保姆级教程(适配各类AI编程IDE)
07
Cursor 又偷偷更新,这个功能太实用:Visual Editor for Cursor Browser
08
【超详细教程】手把手教你从微软官网免费下载Windows 10官方原版ISO镜像(2025最新版)
09
安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口(持续更新)
10
BongoCat - 跨平台键盘猫动画工具