技术栈
multi-head
西西弗Sisyphus
2 小时前
transformer
·
embedding
·
view
·
transpose
·
multi-head
从零实现 Transformer:第 0 部分 - 基础( Foundations)view 重塑形状 和 transpose 交换维度顺序
flyfishview 复用原张量同一块底层内存数据,只是换了一种维度解读方式,不会在内存中创建物理副本。
我是有底线的