昇腾npu

●VON21 天前
架构·昇腾·昇腾npu·gpt-oss-20b·昇腾训练营
深入昇腾NPU:从架构到算子开发的全栈探索在当今人工智能高速发展的浪潮中,算力已成为推动AI创新的核心驱动力。作为国产AI芯片的代表,华为昇腾NPU(Neural Processing Unit)凭借其创新的达芬奇架构和强大的异构计算能力,正在重塑AI计算的格局。本文将深入探讨昇腾NPU的技术特性,并重点介绍基于CANN(Compute Architecture for Neural Networks)的算子开发实践。
●VON23 天前
人工智能·昇腾·昇腾npu·昇腾训练营
CANN卷积算子深度优化:以ResNet推理为例2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。获得Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机,平板、开发板等大奖。
熊文豪1 个月前
昇腾·1024程序员节·昇腾npu·gpt-oss-20b
昇腾NPU部署GPT-OSS-20B混合专家模型:从环境配置到性能优化的完整实践指南本文详细记录了使用GitCode平台的免费昇腾Notebook实例,完成GPT-OSS-20B模型(一个21B参数的混合专家模型,激活参数3.6B)的环境配置、模型部署、性能测试与优化的全过程。通过编写自定义转换脚本将PyTorch模型转换为MindSpore格式,并在昇腾NPU上运行基准测试脚本,进行5次重复测试以获取可靠的数据统计。最终,我们评估了模型在不同场景下的推理速度和吞吐量,并提供了优化建议。整个过程旨在帮助开发者在昇腾NPU上高效部署大型MoE模型。
wangshuo(24考研上岸版)5 个月前
llamafactory·昇腾npu·npu微调qwen3
基于昇腾NPU部署llamafactory单机多卡微调Qwen3教程华为云首页 点击右上角控制台点击搜索框->搜索“ModelArts”->选择AI开发平台ModelArts->进入平台后点击开发者空间
我是有底线的