技术栈
ops-nn
塔中妖
6 小时前
ops-nn
ops-nn 算子开发快速入门指南
cann组织链接:https://atomgit.com/cann ops-nn仓库链接:https://atomgit.com/cann/ops-nn
TechWJ
7 小时前
人工智能
·
深度学习
·
神经网络
·
cann
·
ops-nn
CANN ops-nn神经网络算子库技术剖析:NPU加速的基石
本文基于CANN开源社区的ops-nn仓库进行技术解读在深度学习领域,算子(Operator)是神经网络的基本计算单元。从简单的加减乘除到复杂的卷积池化,每一个网络层的计算都离不开算子的支撑。对于AI芯片来说,算子库的丰富程度和性能水平直接决定了其生态竞争力。
熊文豪
8 小时前
性能优化
·
cann
·
ops-nn
CANN ops-nn 算子调试与性能优化
cann组织链接:https://atomgit.com/cann ops-nn仓库链接:https://atomgit.com/cann/ops-nn
熊文豪
9 小时前
cann
·
ops-nn
CANN ops-nn 归一化算子实现原理
cann组织链接:https://atomgit.com/cann ops-nn仓库链接:https://atomgit.com/cann/ops-nn
熊文豪
9 小时前
算子
·
cann
·
ops-nn
CANN ops-nn 量化技术深度剖析
cann组织链接:https://atomgit.com/cann ops-nn仓库链接:https://atomgit.com/cann/ops-nn
小镇敲码人
10 小时前
c++
·
华为
·
acl
·
cann
·
ops-nn
探索CANN框架中TBE仓库:张量加速引擎的优化之道
在人工智能计算领域,CANN框架以其高效的异构计算能力脱颖而出,支持从模型开发到部署的全流程。作为CANN的重要组成部分,TBE(Tensor Boost Engine)仓库专注于张量运算的加速引擎,提供自定义算子的开发工具和内核优化框架。它允许开发者使用领域特定语言(DSL)编写高性能算子,针对Ascend硬件实现极致优化。TBE仓库开源后,成为构建自定义AI操作的首选工具,帮助处理复杂场景如量化、融合和并行计算。
熊文豪
11 小时前
cann
·
ops-nn
从CANN到ops-nn:循环神经网络RNN算子实战
cann组织链接:https://atomgit.com/cann ops-nn仓库链接:https://atomgit.com/cann/ops-nn
聆风吟º
12 小时前
cann
·
异构计算
·
ops-nn
CANN异构计算:利用ops-nn仓库实现自定义算子的高性能并行开发
在AI模型日益复杂、硬件平台日趋多样化的今天,单一计算单元(如仅CPU或仅GPU)已难以满足高性能、低功耗的部署需求。异构计算——即协同调度CPU、GPU、NPU、DSP等多种计算资源——成为突破性能瓶颈的关键路径。然而,异构编程面临三大挑战:设备抽象不统一、数据搬运开销大、并行任务调度复杂。开发者若直接使用底层硬件API(如CUDA、OpenCL),将陷入繁琐的内存管理与同步逻辑中,严重拖慢开发效率。
Lethehong
13 小时前
cann
·
ops-nn
技术深度解析:基于CANN仓库与ops-nn的AIGC应用实践
在AIGC(人工智能生成内容)领域,随着大模型的不断演进与算力的提升,AI的应用已经渗透到多个层面,特别是深度学习领域。作为推动AI技术发展的核心动力,计算库和算子(operator)一直是技术创新的基石。而在当前的AI训练与推理环境中,CANN(Compute Architecture for Neural Networks)与其子模块ops-nn的引入,无疑为AI技术提供了更高效、更灵活的计算支持。
我是有底线的