transformer学习

transformer

李宏毅老师的课:https://www.youtube.com/watch?v=ugWDIIOHtPA&list=PLJV_el3uVTsOK_ZK5L0Iv_EQoL1JefRL4&index=60

知乎上的文章:Transformer模型详解(图解最完整版)

主要参考tensorflow的官方文档:理解语言的 Transformer 模型

还有一篇英文文章讲得也不错:The Illustrated Transformer

google官方的blog里面有动画也不错:Transformer:一种用于语言理解的新型神经网络架构,建议翻译着看

根据tensorflow的官方文档写的代码,包含了数据集:

关于新机器测试,李沐老师也有在做:https://t.bilibili.com/695161992084717573?tab=2

bert

知乎bert简介:什么是BERT?

ensorflow的官方文档(还没有中文版):使用 BERT 对文本进行分类

bert源码实现:从零实现BERT网络模型

gpt

相关推荐
点我头像干啥29 分钟前
用 PyTorch 构建液态神经网络(LNN):下一代动态深度学习模型
pytorch·深度学习·神经网络
小白狮ww1 小时前
VASP 教程:VASP 机器学习力场微调
人工智能·深度学习·机器学习
呆头鹅AI工作室2 小时前
[2025CVPR]SEEN-DA:基于语义熵引导的领域感知注意力机制
人工智能·深度学习·机器学习
听风ツ2 小时前
固高运动控制
学习
西岭千秋雪_2 小时前
Redis缓存架构实战
java·redis·笔记·学习·缓存·架构
XvnNing2 小时前
【Verilog硬件语言学习笔记4】FPGA串口通信
笔记·学习·fpga开发
西柚小萌新2 小时前
【深度学习:进阶篇】--4.3.seq2seq与Attention机制
人工智能·深度学习
求索小沈2 小时前
ubuntu22.04 安装cuda cudnn
人工智能·深度学习
牛奶咖啡133 小时前
学习设计模式《十六》——策略模式
学习·设计模式·策略模式·认识策略模式·策略模式的优缺点·何时选用策略模式·策略模式的使用示例
FF-Studio3 小时前
【硬核数学】3. AI如何应对不确定性?概率论为模型注入“灵魂”《从零构建机器学习、深度学习到LLM的数学认知》
大数据·人工智能·深度学习·机器学习·数学建模·自然语言处理·概率论