transformer学习

transformer

李宏毅老师的课:https://www.youtube.com/watch?v=ugWDIIOHtPA&list=PLJV_el3uVTsOK_ZK5L0Iv_EQoL1JefRL4&index=60

知乎上的文章:Transformer模型详解(图解最完整版)

主要参考tensorflow的官方文档:理解语言的 Transformer 模型

还有一篇英文文章讲得也不错:The Illustrated Transformer

google官方的blog里面有动画也不错:Transformer:一种用于语言理解的新型神经网络架构,建议翻译着看

根据tensorflow的官方文档写的代码,包含了数据集:

关于新机器测试,李沐老师也有在做:https://t.bilibili.com/695161992084717573?tab=2

bert

知乎bert简介:什么是BERT?

ensorflow的官方文档(还没有中文版):使用 BERT 对文本进行分类

bert源码实现:从零实现BERT网络模型

gpt

相关推荐
iナナ10 分钟前
Java自定义协议的发布订阅式消息队列(二)
java·开发语言·jvm·学习·spring·消息队列
万俟淋曦10 分钟前
【论文速递】2025年第34周(Aug-17-23)(Robotics/Embodied AI/LLM)
人工智能·深度学习·机器学习·ai·机器人·论文·具身智能
车软派开发学长12 分钟前
车软嵌入式AUTOSAR学习教材推荐
学习
jtymyxmz19 分钟前
《Maya 2024 超级学习手册》3.2.7 实例:制作石膏模型
学习·maya
知识分享小能手21 分钟前
CentOS Stream 9入门学习教程,从入门到精通,CentOS Stream 9 进程管理 —语法详解与实战案例(8)
linux·学习·centos
roman_日积跬步-终至千里29 分钟前
【计算机视觉(5)】特征检测与匹配基础篇:从Harris到SIFT的完整流程
人工智能·深度学习·计算机视觉
window201934 分钟前
青少年编程考级的意义:建立目标与培养自主学习习惯
学习·青少年编程
萝卜青今天也要开心44 分钟前
2025年下半年系统架构设计师考后分享
java·数据库·redis·笔记·学习·系统架构
dragoooon341 小时前
[C++——lesson16.STL 学习——【vector的使用】]
c++·学习
AI街潜水的八角1 小时前
番茄成熟度检测和识别3:基于深度学习YOLOv12神经网络实现番茄成熟度检测和识别(含训练代码、数据集和GUI交互界面)
深度学习·神经网络·yolo