昇腾

●VON4 小时前
架构·昇腾·昇腾npu·gpt-oss-20b·昇腾训练营
深入昇腾NPU:从架构到算子开发的全栈探索在当今人工智能高速发展的浪潮中,算力已成为推动AI创新的核心驱动力。作为国产AI芯片的代表,华为昇腾NPU(Neural Processing Unit)凭借其创新的达芬奇架构和强大的异构计算能力,正在重塑AI计算的格局。本文将深入探讨昇腾NPU的技术特性,并重点介绍基于CANN(Compute Architecture for Neural Networks)的算子开发实践。
摘星编程18 小时前
人工智能·华为·gitcode·昇腾
昇腾NPU性能调优实战:INT8+批处理优化Mistral-7B全记录目录昇腾NPU性能调优实战:INT8+批处理优化Mistral-7B全记录摘要昇腾NPU性能调用概览架构特性与优化基础
●VON3 天前
人工智能·昇腾·昇腾npu·昇腾训练营
CANN卷积算子深度优化:以ResNet推理为例2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。获得Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机,平板、开发板等大奖。
小草cys9 天前
服务器·人工智能·华为·昇腾·910b
华为910B服务器(搭载昇腾Ascend 910B AI 芯片的AI服务器查看服务器终端信息在华为 910B 服务器(通常指搭载 昇腾 Ascend 910B AI 芯片 的 AI 服务器)上,若你想查看服务器终端信息(如设备状态、NPU 信息、驱动版本、算力使用情况等),可通过以下命令和工具进行操作。这些操作通常在 Linux 系统终端(如 Ubuntu/CentOS) 中执行。
wei_shuo11 天前
大模型·llama·昇腾
Llama-2-7b 昇腾 NPU 测评总结:核心性能数据、场景适配建议与硬件选型参考本文为适配大模型国产化部署需求,以 Llama-2-7b 为对象,在 GitCode Notebook 昇腾 NPU(910B)环境中完成从依赖安装到模型部署的全流程落地,并通过六大维度测评验证:单请求吞吐量稳定 15.6-17.6 tokens / 秒,batch=4 时总吞吐量达 63.33 tokens / 秒,16GB 显存即可支撑高并发,最终提供可复现的部署方案、性能基准数据及硬件选型建议,助力高效落地国产算力大模型应用。
熊文豪13 天前
昇腾·1024程序员节·昇腾npu·gpt-oss-20b
昇腾NPU部署GPT-OSS-20B混合专家模型:从环境配置到性能优化的完整实践指南本文详细记录了使用GitCode平台的免费昇腾Notebook实例,完成GPT-OSS-20B模型(一个21B参数的混合专家模型,激活参数3.6B)的环境配置、模型部署、性能测试与优化的全过程。通过编写自定义转换脚本将PyTorch模型转换为MindSpore格式,并在昇腾NPU上运行基准测试脚本,进行5次重复测试以获取可靠的数据统计。最终,我们评估了模型在不同场景下的推理速度和吞吐量,并提供了优化建议。整个过程旨在帮助开发者在昇腾NPU上高效部署大型MoE模型。
倔强的石头10614 天前
大模型·llama·昇腾
昇腾NPU运行Llama模型全攻略:环境搭建、性能测试、问题解决一网打尽最近几年,AI 大模型火得一塌糊涂,特别是像 Llama 这样的开源模型,几乎成了每个技术团队都在讨论的热点。不过,这些"巨无霸"模型虽然能力超强,但对硬件的要求也高得吓人。这时候,华为的昇腾 NPU 就派上用场了。
羊城迷鹿14 天前
昇腾·npu·vllm
华为昇腾NPU驱动问题排查与vLLM部署踩坑记录本文记录了华为NPU服务器驱动失效问题的完整排查与解决过程。服务器重启后npu-smi info命令失效,经诊断发现是内核自动升级导致当前运行的5.15.0-153版本缺少Ascend驱动模块。通过对比/lib/modules目录下各内核版本的驱动文件,确认5.15.0-144-generic版本包含完整的24个驱动模块。随后修改GRUB配置回退至该内核版本,并通过锁定内核包和禁用自动升级机制防止问题再次发生。在尝试部署vLLM框架时,遇到了NumPy版本冲突、缺少依赖模块、C++编译环境配置、CANN
叶庭云1 个月前
开源·昇腾·开发效率·tilelang·算子编程语言·deepseek-v3.2·国产 ai 硬件
一文了解国产算子编程语言 TileLang,TileLang 对国产开源生态的影响与启示🍉 CSDN 叶庭云:https://yetingyun.blog.csdn.net/随着人工智能(Artificial Intelligence,AI)技术的迅猛发展,深度学习模型的复杂度和规模正呈指数级增长,这给底层计算效率带来了前所未有的挑战。AI 算子是构成深度学习模型的基本计算单元,其性能直接决定了整个模型的训练和推理效率。然而,传统的算子开发语言存在诸多瓶颈。例如,CUDA 编程门槛高;Triton (提供了领域专用的语言和编译器)等现有领域专用语言(Domain-Specific Lang
GPUStack1 个月前
大模型·llm·昇腾·npu·分布式推理
昇腾多机推理极速上手:10倍简化的 DeepSeek R1 超大规模模型部署在昇腾 NPU 上部署超大规模模型,往往面临一个现实难题:目前主流的官方推理引擎 MindIE 的多机分布式推理虽然性能表现尚可,但配置流程异常复杂。从环境准备、配置初始化到参数细节调整,每一步都需要格外谨慎,否则极易因细节遗漏或配置错误而导致部署失败,问题定位也十分困难。
skywalk81632 个月前
人工智能·昇腾·ascendc
Ascend C算子开发能力认证考试伴侣-昇腾Ascend C编程入门教程Ascend C算子开发能力认证(中级):是开发者在Ascend C算子设计、实现与框架调用能力的权威认证。通过该认证,您将展示您在深度学习框架中的Ascend C算子开发能力,为业界所认可。
图波列夫3 个月前
昇腾·ai芯片·ascend c
Ascend DrivingSDK 中的 modulated_deform_conv2d(一)Ascend DrivingSDK 是基于昇腾 NPU 平台开发的适用于自动驾驶场景的算子和模型加速库,提供了一系列高性能的算子和模型加速接口,支持 PyTorch 框架。
楚潸潸3 个月前
深度学习·边缘计算·onnx·昇腾·om模型
从onnx模型到om模型的全自动化转化项目位置:https://github.com/whypoxic/Ascend-ATC-tool_onnx2om
派阿喵搞电子5 个月前
学习·昇腾
学习昇腾开发的第二天--PC机远程登录开发板1、第一天我们验证了套件是正常的2、今天在PC机实现远程登录方案,寻找一根野生网线,将野生网线的一端连接到开发板,另一端接到电脑。
工具人呵呵5 个月前
香橙派·昇腾·ascend·算子开发
[嵌入式AI从0开始到入土]18_Ascend C算子开发环境(S5赛季)注:等我摸完鱼再把链接补上 可以关注我的B站号工具人呵呵的个人空间,后期会考虑出视频教程,务必催更,以防我变身鸽王。
Nicolas8936 个月前
华为·信创·模型部署·昇腾·ascend·vllm·模型推理
【大模型实战篇】华为信创环境采用vllm部署QwQ-32B模型本文分享在华为昇腾机器上部署QwQ-32B模型的实践。首先华为自己是提供了一套在信创机器(NPU)上部署模型的方案【1】,但是部署之后,测试发现会有输出截断的现象。QwQ-32B本身是支持128k的最大上下文长度,定位可能是max-model-len的设置没有生效,但是华为的启动参数中只有maxSeqLen以及maxInputTokenLen参数,修改后也不奏效。
mzak7 个月前
qwen·鲲鹏·昇腾·deepseek·gpustack
鲲鹏+昇腾部署集群管理软件GPUStack,两台服务器搭建双节点集群【实战详细踩坑篇】配置:2台鲲鹏32C2 + 2Atlas300I duo,之前看网上文档,目前GPUstack只支持910B芯片,想尝试一下能不能310P也部署试试,毕竟华为的集群软件要收费。 系统:openEuler22.03-LTS 驱动:24.1.rc3
博云技术社区7 个月前
昇腾·博云·deepseek·ai一体机
昇腾+DeepSeeK | 博云联合昇腾打造满血版一体机在AI 浪潮与大模型落地需求的双重驱动下,博云携手江苏鲲鹏・昇腾生态创新中心,基于昇腾AI与DeepSeek大模型能力,重磅推出DeepSeek满血版一体机。该方案通过智能算力分配、集群网络优化、行业模型智能化训练等技术,为政务、金融、制造等行业提供「高精度、高可靠、高安全」的智能化转型方案。
林泽毅7 个月前
python·深度学习·昇腾·英伟达·swanlab·寒武纪·训练实战
SwanLab硬件监控:英伟达、昇腾、寒武纪SwanLab在跟踪实验的过程中,会自动监控机器的硬件资源情况,并记录到 「系统」图表 当中。目前SwanLab已支持监控3款AI计算芯片(华为昇腾、英伟达、寒武纪)的硬件资源情况,涵盖显卡利用率、显存占用率、显卡温度、显卡功率等指标。
Zain Lau8 个月前
人工智能·python·昇腾
MindIE 基于昇腾910B2 aarch64环境profileMindIE镜像获取 https://www.hiascend.com/developer/ascendhub/detail/af85b724a7e5469ebd7ea13c3439d48f