transformer学习

transformer

李宏毅老师的课:https://www.youtube.com/watch?v=ugWDIIOHtPA&list=PLJV_el3uVTsOK_ZK5L0Iv_EQoL1JefRL4&index=60

知乎上的文章:Transformer模型详解(图解最完整版)

主要参考tensorflow的官方文档:理解语言的 Transformer 模型

还有一篇英文文章讲得也不错:The Illustrated Transformer

google官方的blog里面有动画也不错:Transformer:一种用于语言理解的新型神经网络架构,建议翻译着看

根据tensorflow的官方文档写的代码,包含了数据集:

关于新机器测试,李沐老师也有在做:https://t.bilibili.com/695161992084717573?tab=2

bert

知乎bert简介:什么是BERT?

ensorflow的官方文档(还没有中文版):使用 BERT 对文本进行分类

bert源码实现:从零实现BERT网络模型

gpt

相关推荐
Larry_Yanan6 分钟前
QML学习笔记(四十二)QML的MessageDialog
c++·笔记·qt·学习·ui
生命是有光的23 分钟前
【深度学习】神经网络基础
人工智能·深度学习·神经网络
能不能别报错35 分钟前
K8s学习笔记(十九) K8s资源限制
笔记·学习·kubernetes
十安_数学好题速析1 小时前
倍数关系:最多能选出多少个数
笔记·学习·高考
vue学习1 小时前
docker 学习dockerfile 构建 Nginx 镜像-部署 nginx 静态网
java·学习·docker
信田君95272 小时前
瑞莎星瑞(Radxa Orion O6) 基于 Android OS 使用 NPU的图片模糊查找APP 开发
android·人工智能·深度学习·神经网络
数智顾问3 小时前
基于深度学习的卫星图像分类(Kaggle比赛实战)——从数据预处理到模型调优的全流程解析
深度学习
望获linux3 小时前
【实时Linux实战系列】Linux 内核的实时组调度(Real-Time Group Scheduling)
java·linux·服务器·前端·数据库·人工智能·深度学习
程序员大雄学编程3 小时前
「深度学习笔记4」深度学习优化算法完全指南:从梯度下降到Adam的实战详解
笔记·深度学习·算法·机器学习