(1)编程基础:
(2)CPU性能优化
(3)GPU性能优化
(4)AI推理框架
(5)AI编译器
| 目录 | 学习资料 |
|---|---|
| TVM | |
| MLIR | |
| IREE | |
| LLVM | |
| tensorcore | |
| XLA |
(6)深度学习优化与AI加速
| 目录 | 学习资料 |
|---|---|
| 模型压缩与量化 | https://www.bilibili.com/video/BV1c8wNe1ErX?spm_id_from=333.1387.favlist.content.click |
| winograd | |
| strassen | |
| implicit gemm | |
| cutlass | |
| cublas | |
| 分布式 | |
| fastertransformer |
(7)大模型
| 目录 | 学习资料 |
|---|---|
| 大模型 | https://www.bilibili.com/video/BV1PB6XYFET2?spm_id_from=333.1387.favlist.content.click |
| AIGC | https://www.bilibili.com/video/BV1BJ4m1e7g8?spm_id_from=333.1387.favlist.content.click |