transformer学习

transformer

李宏毅老师的课:https://www.youtube.com/watch?v=ugWDIIOHtPA&list=PLJV_el3uVTsOK_ZK5L0Iv_EQoL1JefRL4&index=60

知乎上的文章:Transformer模型详解(图解最完整版)

主要参考tensorflow的官方文档:理解语言的 Transformer 模型

还有一篇英文文章讲得也不错:The Illustrated Transformer

google官方的blog里面有动画也不错:Transformer:一种用于语言理解的新型神经网络架构,建议翻译着看

根据tensorflow的官方文档写的代码,包含了数据集:

关于新机器测试,李沐老师也有在做:https://t.bilibili.com/695161992084717573?tab=2

bert

知乎bert简介:什么是BERT?

ensorflow的官方文档(还没有中文版):使用 BERT 对文本进行分类

bert源码实现:从零实现BERT网络模型

gpt

相关推荐
jz_ddk1 小时前
[学习] 卫星导航的码相位与载波相位计算
学习·算法·gps·gnss·北斗
汗流浃背了吧,老弟!1 小时前
什么是ResNet
人工智能·深度学习
哥布林学者1 小时前
吴恩达深度学习课程五:自然语言处理 第一周:循环神经网络 (三)语言模型
深度学习·ai
小途软件1 小时前
高校宿舍访客预约管理平台开发
java·人工智能·pytorch·python·深度学习·语言模型
华清远见成都中心2 小时前
人工智能要学习的课程有哪些?
人工智能·学习
hssfscv2 小时前
Javaweb学习笔记——后端实战2_部门管理
java·笔记·学习
白帽子黑客罗哥2 小时前
不同就业方向(如AI、网络安全、前端开发)的具体学习路径和技能要求是什么?
人工智能·学习·web安全
捕风捉你2 小时前
【AI转行04】特征工程:治疗 AI 的“学不会”和“想太多”
人工智能·深度学习·机器学习
lixzest3 小时前
C++上位机软件开发入门深度学习
开发语言·c++·深度学习
AI模块工坊3 小时前
【AAAI 2026】即插即用 Spikingformer 重构残差连接,打造高效脉冲 Transformer
深度学习·重构·transformer