技术栈
Transformer以及BERT阅读参考博文
mumukehao
2025-02-14 13:56
Transformer以及BERT阅读参考博文
Transformer学习:
已有博主的讲解特别好了:
李沐:
Transformer论文逐段精读【论文精读】_哔哩哔哩_bilibili
知乎:
Transformer模型详解(图解最完整版) - 知乎
个人杂想:
Q K T ∗ V QK^{T}*V QKT∗V中, Q K T QK^T QKT其实可以理解为相似性矩阵S,那么 S ∗ V S*V S∗V其实就相当于相似性矩阵对原始的嵌入加权求和。这感觉就是GAT的一个思想源泉。
残差连接和concat挺重要的
BERT
BERT模型架构详解 - 知乎
李沐:
BERT 论文逐段精读【论文精读】_哔哩哔哩_bilibili
文本属性图
上一篇:
时尚搭配助手,深度解析用Keras构建智能穿搭推荐系统
下一篇:
DeepSeek从入门到精通:提示词设计的系统化指南
热门推荐
01
太炸裂了!清华大学deepseek从入门到精通使用手册又出第三版了,《普通人如何抓住DeepSeek红利》(无套路,直接下载)
02
DeepSeek各版本说明与优缺点分析
03
如何在WPS和Word/Excel中直接使用DeepSeek功能
04
本地部署DeepSeek教程(Mac版本)
05
本地化部署AI知识库:基于Ollama+DeepSeek+AnythingLLM保姆级教程
06
DeepSeek本地部署详细指南
07
DeepSeek R1本地化部署 Ollama + Chatbox 打造最强 AI 工具
08
Page Assist - 本地Deepseek模型 Web UI 的安装和使用
09
DeepSeek r1本地安装全指南
10
本地部署DeepSeek后的调用与删除全攻略