技术栈
blackwell
KIDGINBROOK
5 小时前
gpu
·
cuda
·
blackwell
Blackwell架构学习
最近学习了一下Blackwell相关的架构,本文整理一下,最大的感受是看到GPU越来越NPU。首先约定一下后续的符号,假设TensorCore处理的D = A x B + D,A和B为bf16,D为fp32。
我是有底线的