ascend c

Archie_IT12 天前
ascend c·昇腾 catlass·catlass 算子开发·昇腾 npu 算子开发·昇腾高性能算子
深度解构 Catlass:昇腾高性能算子开发的 C++ 模板编程范式目录一、 前言二、 Shape-Driven (形状驱动)三、 调度策略四、 进阶范式:定制化你的算子
LZL_SQ21 天前
人工智能·昇腾·cann·ascend c
昇腾NPU架构设计 从抽象硬件模型到物理实现在硅基芯片上为神经网络计算重构冯·诺依曼体系,探寻专用加速器的设计哲学与工程实现昇腾NPU(Neural Processing Unit)作为华为自研的AI加速器,其架构设计体现了"软件定义硬件"与"硬件加速软件"的双向协同哲学。本文基于我十三年的芯片设计经验,深度解构昇腾达芬奇架构从抽象硬件模型到物理实现的完整技术栈。我们将揭示AI Core内部的Cube计算单元如何通过脉动阵列实现矩阵计算的硬件化,多级存储体系如何打破冯·诺依曼瓶颈,以及指令调度系统如何实现计算与搬运的完美重叠。文章包含一个完整的As
七夜zippoe21 天前
人工智能·昇腾·cann·ascend c·l1 buffer
NPU存储体系 数据在芯片内的旅程与分层优化策略打破冯·诺依曼瓶颈的七层存储迷宫解密:从HBM到寄存器的数据生命周期管理艺术目录🎯 摘要🏗️ 第一章 存储墙挑战 从冯·诺依曼瓶颈到分层存储革命
七夜zippoe1 个月前
架构·昇腾·cann·ascend c·pow
昇腾AI计算架构的基石 - 深度剖析CANN与Ascend C目录📖 摘要🏗️ 一. CANN架构设计理念:软硬件协同的工程哲学1.1 为什么需要专用AI软件栈?
行走正道1 个月前
triton·昇腾·cann·ascend c·计算单元
超越CUDA:Triton硬件无关性在昇腾平台上的实现挑战与突破目录摘要1. 引言:硬件生态锁定的技术困局1.1 CUDA生态的"软锁定"效应1.2 昇腾平台的差异化架构挑战
JarryStudy1 个月前
人工智能·算法·昇腾·cann·ascend c
自动调优在Triton-on-Ascend中的应用:从参数优化到性能极致挖掘目录摘要1. 自动调优技术概述1.1 自动调优的核心价值1.2 Triton自动调优架构设计2. 自动调优核心技术原理
七夜zippoe1 个月前
triton·昇腾·cann·ascend c·gather
Triton算子开发范式:从向量加法和Gather算子看高效编程实践目录摘要1. Triton算子开发范式的核心价值1.1 昇腾平台算子开发的挑战与机遇1.2 Triton编程模型的核心优势
七夜zippoe1 个月前
kernel·triton·昇腾·cann·ascend c
Triton - Ascend算子开发基础解析:解锁高效NPU编程的新范式目录摘要1 引言:为什么选择Triton进行Ascend算子开发?2 Triton与Ascend C架构对比分析
wuli_滔滔1 个月前
算子·昇腾·atlas·ascend c·cann]
昇腾Atlas加速卡与Ascend C:从硬件基石到编程哲学的深度解析与实战目录摘要1. 引子:我们为何需要“另一种”AI芯片和编程模型?2. 昇腾Atlas加速卡硬件架构:达芬奇核心的匠心独运
七夜zippoe1 个月前
昇腾·cann·ascend c·tiling·addcustom
通关秘籍第一式:十分钟彻底读懂Ascend C算子开发中级认证目录摘要1. 认证价值:为什么中级认证是能力分水岭?1.1 从功能正确到性能达标1.2 从单核到多核协同
七夜zippoe2 个月前
昇腾·cann·算子开发·ascend c·kernel 算子
Ascend C 算子开发模式全解析:从 Kernel 到工程化目录摘要一、背景介绍:为什么需要特定的算子开发模式?二、昇腾AI Core基础架构浅析三、原理详解:两种开发模式的深度对比
七夜zippoe2 个月前
昇腾·cann·核函数·ascend c·向量加法
Ascend C 编程模型揭秘:深入理解核函数、任务并行与流水线优化目录摘要一、背景介绍:从串行思维到并行范式的范式转移二、核函数(Kernel Function):并行计算的执行单元
图波列夫5 个月前
昇腾·ai芯片·ascend c
Ascend DrivingSDK 中的 modulated_deform_conv2d(一)Ascend DrivingSDK 是基于昇腾 NPU 平台开发的适用于自动驾驶场景的算子和模型加速库,提供了一系列高性能的算子和模型加速接口,支持 PyTorch 框架。
Tensorrrrrr1 年前
c语言·开发语言·华为·昇腾·算子开发·ascend c
【2024第一期CANN训练营】全面掌握Ascend C算子近期参加了华为的CANN训练营,学习到了Ascend C的很多知识,训练营也步入尾声,在这里利用所学知识,分享Sinh的算子实现过程
华为云开发者联盟2 年前
算子·昇腾·cann·华为云开发者联盟·ascend c
一文教你如何调用Ascend C算子本文分享自华为云社区《一文教你如何调用Ascend C算子》,作者: 昇腾CANN。Ascend C是CANN针对算子开发场景推出的编程语言,原生支持C和C++标准规范,兼具开发效率和运行性能。基于Ascend C编写的算子程序,通过编译器编译和运行时调度,运行在昇腾AI处理器上。使用Ascend C,开发者可以基于昇腾AI硬件高效实现自定义的创新算法。
我是有底线的