技术栈
unsqueeze
西西弗Sisyphus
1 个月前
transformer
·
attention
·
unsqueeze
·
self-attention
·
残差
·
residual
·
squeeze
从零实现Transformer:第 4 部分 - Residual Connection的两种实现 Pre-LN 和 Post-LN
flyfishPre-LN = Pre-Layer Normalization Post-LN = Post-Layer Normalization
von Neumann
3 年前
人工智能
·
pytorch
·
深度学习
·
unsqueeze
·
维度
深入浅出Pytorch函数——torch.unsqueeze
分类目录:《深入浅出Pytorch函数》总目录 相关文章: · 深入浅出Pytorch函数——torch.squeeze · 深入浅出Pytorch函数——torch.unsqueeze
我是有底线的