昇腾

叶庭云15 天前
开源·昇腾·开发效率·tilelang·算子编程语言·deepseek-v3.2·国产 ai 硬件
一文了解国产算子编程语言 TileLang,TileLang 对国产开源生态的影响与启示🍉 CSDN 叶庭云:https://yetingyun.blog.csdn.net/随着人工智能(Artificial Intelligence,AI)技术的迅猛发展,深度学习模型的复杂度和规模正呈指数级增长,这给底层计算效率带来了前所未有的挑战。AI 算子是构成深度学习模型的基本计算单元,其性能直接决定了整个模型的训练和推理效率。然而,传统的算子开发语言存在诸多瓶颈。例如,CUDA 编程门槛高;Triton (提供了领域专用的语言和编译器)等现有领域专用语言(Domain-Specific Lang
GPUStack20 天前
大模型·llm·昇腾·npu·分布式推理
昇腾多机推理极速上手:10倍简化的 DeepSeek R1 超大规模模型部署在昇腾 NPU 上部署超大规模模型,往往面临一个现实难题:目前主流的官方推理引擎 MindIE 的多机分布式推理虽然性能表现尚可,但配置流程异常复杂。从环境准备、配置初始化到参数细节调整,每一步都需要格外谨慎,否则极易因细节遗漏或配置错误而导致部署失败,问题定位也十分困难。
skywalk81631 个月前
人工智能·昇腾·ascendc
Ascend C算子开发能力认证考试伴侣-昇腾Ascend C编程入门教程Ascend C算子开发能力认证(中级):是开发者在Ascend C算子设计、实现与框架调用能力的权威认证。通过该认证,您将展示您在深度学习框架中的Ascend C算子开发能力,为业界所认可。
图波列夫2 个月前
昇腾·ai芯片·ascend c
Ascend DrivingSDK 中的 modulated_deform_conv2d(一)Ascend DrivingSDK 是基于昇腾 NPU 平台开发的适用于自动驾驶场景的算子和模型加速库,提供了一系列高性能的算子和模型加速接口,支持 PyTorch 框架。
楚潸潸2 个月前
深度学习·边缘计算·onnx·昇腾·om模型
从onnx模型到om模型的全自动化转化项目位置:https://github.com/whypoxic/Ascend-ATC-tool_onnx2om
派阿喵搞电子4 个月前
学习·昇腾
学习昇腾开发的第二天--PC机远程登录开发板1、第一天我们验证了套件是正常的2、今天在PC机实现远程登录方案,寻找一根野生网线,将野生网线的一端连接到开发板,另一端接到电脑。
工具人呵呵4 个月前
香橙派·昇腾·ascend·算子开发
[嵌入式AI从0开始到入土]18_Ascend C算子开发环境(S5赛季)注:等我摸完鱼再把链接补上 可以关注我的B站号工具人呵呵的个人空间,后期会考虑出视频教程,务必催更,以防我变身鸽王。
Nicolas8935 个月前
华为·信创·模型部署·昇腾·ascend·vllm·模型推理
【大模型实战篇】华为信创环境采用vllm部署QwQ-32B模型本文分享在华为昇腾机器上部署QwQ-32B模型的实践。首先华为自己是提供了一套在信创机器(NPU)上部署模型的方案【1】,但是部署之后,测试发现会有输出截断的现象。QwQ-32B本身是支持128k的最大上下文长度,定位可能是max-model-len的设置没有生效,但是华为的启动参数中只有maxSeqLen以及maxInputTokenLen参数,修改后也不奏效。
mzak6 个月前
qwen·鲲鹏·昇腾·deepseek·gpustack
鲲鹏+昇腾部署集群管理软件GPUStack,两台服务器搭建双节点集群【实战详细踩坑篇】配置:2台鲲鹏32C2 + 2Atlas300I duo,之前看网上文档,目前GPUstack只支持910B芯片,想尝试一下能不能310P也部署试试,毕竟华为的集群软件要收费。 系统:openEuler22.03-LTS 驱动:24.1.rc3
博云技术社区7 个月前
昇腾·博云·deepseek·ai一体机
昇腾+DeepSeeK | 博云联合昇腾打造满血版一体机在AI 浪潮与大模型落地需求的双重驱动下,博云携手江苏鲲鹏・昇腾生态创新中心,基于昇腾AI与DeepSeek大模型能力,重磅推出DeepSeek满血版一体机。该方案通过智能算力分配、集群网络优化、行业模型智能化训练等技术,为政务、金融、制造等行业提供「高精度、高可靠、高安全」的智能化转型方案。
林泽毅7 个月前
python·深度学习·昇腾·英伟达·swanlab·寒武纪·训练实战
SwanLab硬件监控:英伟达、昇腾、寒武纪SwanLab在跟踪实验的过程中,会自动监控机器的硬件资源情况,并记录到 「系统」图表 当中。目前SwanLab已支持监控3款AI计算芯片(华为昇腾、英伟达、寒武纪)的硬件资源情况,涵盖显卡利用率、显存占用率、显卡温度、显卡功率等指标。
Zain Lau8 个月前
人工智能·python·昇腾
MindIE 基于昇腾910B2 aarch64环境profileMindIE镜像获取 https://www.hiascend.com/developer/ascendhub/detail/af85b724a7e5469ebd7ea13c3439d48f
哦豁灬9 个月前
学习·昇腾·cann
CANN 学习——基于香橙派 KunpengPro(1)异构计算架构CANN(Compute Architecture for Neural Networks)是昇腾针对AI场景推出的异构计算架构,向上支持多种AI框架,包括MindSpore、PyTorch、TensorFlow等,向下服务AI处理器与编程。
华为云开发者联盟9 个月前
ai·大模型·flux·昇腾·npu
开源flux适配昇腾NPU分享,体验120亿参数AI文生图模型这一期我们分享一位开源开发者参与flux适配昇腾NPU的实践经验,欢迎广大开发者对华为技术栈适配进行讨论。
华为云开发者联盟10 个月前
python·鸿蒙·codearts·软件开发·昇腾·云主机
读懂华为开发者空间第一课,让云上开发如此简单近日,华为云上线的《华为开发者空间快速入门》课程,汇聚了理论知识讲解、案例介绍和丰富的实践练习,通过循序渐进的学习路径,开发者可以快速了解华为开发者空间,体验更简洁、更高效、更友好的华为开发者空间应用开发旅程。
yuanlulu10 个月前
人工智能·华为·自然语言处理·nlp·大语言模型·昇腾
mindie推理大语言模型问题及解决方法汇总使用功能mindie 1.0 RC2推理大语言模型,遇到不少问题,记录下解决思路。我的硬件是910B4。
zjun30211 年前
c++·人工智能·华为·昇腾·cann·ascendc
什么是CANN和Ascend C异构计算架构CANN(Compute Architecture for Neural Networks)是华为针对AI场景推出的异构计算架构,向上支持多种AI框架,包括MindSpore、PyTorch、TensorFlow等,向下服务AI处理器与编程,发挥承上启下的关键作用,是提升昇腾AI处理器计算效率的关键平台。同时针对多样化应用场景,提供多层次编程接口,支持用户快速构建基于昇腾平台的AI应用和业务。
Seal软件1 年前
ai·大模型·llm·昇腾·genai
在昇腾Ascend 910B上运行Qwen2.5推理目前在国产 AI 芯片,例如昇腾 NPU 上运行大模型是一项广泛且迫切的需求,然而当前的生态还远未成熟。从底层芯片的算力性能、计算架构的算子优化,到上层推理框架对各种模型的支持及推理加速,仍有很多需要完善的地方。
华为云开发者联盟1 年前
人工智能·鸿蒙·昇腾·1024程序员节
1024 | 码客聚会,云上跃迁,探秘华为云和他的开发者朋友们的故事
叶庭云1 年前
人工智能·华为·昇腾·计算产品线·ai 大模型时代
了解华为计算产品线,昇腾的业务都有哪些?🍉 CSDN 叶庭云:https://yetingyun.blog.csdn.net/随着 ChatGPT 的现象级爆红,它引领了 AI 大模型时代的深刻变革,进而造成 AI 算力资源日益紧缺。与此同时,中美贸易战的持续也使得 AI 算力国产化适配成为必然趋势。