相关推荐
ujainu小3 天前
CANN ops-nn:新增一个自定义激活函数算子的完整流程昇腾CANN3 天前
【cann-samples系列】GroupedMatmul MX量化矩阵乘的深度性能优化实践luozhen1103 天前
CANN AMCT模型压缩工具链全貌解析:从训练后量化到稀疏剪枝的昇腾NPU部署管线——INT8/INT4混合精度量化策略与精度损耗诊断实录详解报告luozhen1104 天前
CANN ops-nn神经网络算子库概念拆解:从矩阵运算到昇腾NPU指令映射的算子注册与内核调度机制类比解读czhm575 天前
CANN AMCT量化压缩工具包深度技术解析:PTQ量化算法与昇腾NPU低比特运算的精度-性能权衡全景解读luozhen1105 天前
CANN Ascend C算子调试工具链深度实战:cpu_run CPU模式仿真与npu_sim NPU仿真调试全流程解析及npuchk内存检查最佳实践czhm575 天前
CANN集合通信库hccl分布式训练从入门到实战:昇腾NPU多卡集群Ring-AllReduce算法原理与性能优化全指南luozhen1106 天前
CANN数学算子库ops-math深度实践:昇腾NPU上张量转换、基础数学运算与随机数生成的原理分析与工程实现czhm576 天前
CANN Python算子开发工具pyasc快速入门与实战:昇腾NPU自定义激活函数开发、调试与性能分析全流程指南xiaoqi9226 天前
CANN神经网络算子库ops-nn从入门到实战:昇腾NPU推理场景下MatMul算子融合优化与性能提升全链路深度解读