技术栈

tensor core

九章云极AladdinEdu
15 小时前
人工智能·tensor core·tpu·混合精度·矩阵计算单元·wmma编程·脉动阵列
AI芯片微架构对比:从NVIDIA Tensor Core到Google TPU的矩阵计算单元人工智能计算的爆发式增长正在重塑现代计算架构的设计理念。在传统的CPU和GPU之外,专门为矩阵计算优化的AI加速器已成为推动深度学习发展的关键力量。在这场技术变革中,NVIDIA的Tensor Core和Google的TPU代表了两种截然不同但同样成功的设计哲学:前者追求在通用计算框架下的专用优化,后者则专注于数据中心推理和训练工作负载的极致效率。
爱听歌的周童鞋
1 年前
pruning·sparse·tensor core
四. TensorRT模型部署优化-pruning(sparse-tensor-core)自动驾驶之心推出的 《CUDA与TensorRT部署实战课程》,链接。记录下个人学习笔记,仅供自己参考
我是有底线的