(1)编程基础:
(2)CPU性能优化
(3)GPU性能优化
(4)AI推理框架
(5)AI编译器
目录 | 学习资料 |
---|---|
TVM | |
MLIR | |
IREE | |
LLVM | |
tensorcore | |
XLA |
(6)深度学习优化与AI加速
目录 | 学习资料 |
---|---|
模型压缩与量化 | https://www.bilibili.com/video/BV1c8wNe1ErX?spm_id_from=333.1387.favlist.content.click |
winograd | |
strassen | |
implicit gemm | |
cutlass | |
cublas | |
分布式 | |
fastertransformer |
(7)大模型
目录 | 学习资料 |
---|---|
大模型 | https://www.bilibili.com/video/BV1PB6XYFET2?spm_id_from=333.1387.favlist.content.click |
AIGC | https://www.bilibili.com/video/BV1BJ4m1e7g8?spm_id_from=333.1387.favlist.content.click |