transformer学习

transformer

李宏毅老师的课:https://www.youtube.com/watch?v=ugWDIIOHtPA&list=PLJV_el3uVTsOK_ZK5L0Iv_EQoL1JefRL4&index=60

知乎上的文章:Transformer模型详解(图解最完整版)

主要参考tensorflow的官方文档:理解语言的 Transformer 模型

还有一篇英文文章讲得也不错:The Illustrated Transformer

google官方的blog里面有动画也不错:Transformer:一种用于语言理解的新型神经网络架构,建议翻译着看

根据tensorflow的官方文档写的代码,包含了数据集:

关于新机器测试,李沐老师也有在做:https://t.bilibili.com/695161992084717573?tab=2

bert

知乎bert简介:什么是BERT?

ensorflow的官方文档(还没有中文版):使用 BERT 对文本进行分类

bert源码实现:从零实现BERT网络模型

gpt

相关推荐
YuhsiHu17 分钟前
【论文精读】ACE-Zero
人工智能·深度学习·计算机视觉·3d·机器人
晴空对晚照21 分钟前
[动手学习深度学习]12.权重衰退
人工智能·深度学习·学习
宇寒风暖28 分钟前
HTML嵌入CSS样式超详解(尊享)
前端·css·笔记·学习·html
_zwy2 小时前
通义万相2.1 图生视频:为AI绘梦插上翅膀,开启ALGC算力领域新纪元
人工智能·深度学习·计算机视觉·ai作画
虾球xz2 小时前
游戏引擎学习第149天
人工智能·学习·游戏引擎
没学上了2 小时前
yolov8自定义实例分割
人工智能·深度学习·opencv·yolo·逻辑回归
奕天者2 小时前
C++学习笔记(十七)——类之封装
c++·笔记·学习
亭墨2 小时前
linux0.11内核源码修仙传第六章——中断初始化
linux·c语言·驱动开发·学习·面试
好多大米2 小时前
[资源分享]-web3/区块链/学习路线/资料/找工作方式/水龙头
学习·web3·区块链
李长渊哦3 小时前
学习文章:Spring Boot 中如何使用 `@Async` 实现异步处理
java·spring boot·学习