cann

禁默1 小时前
人工智能·信号处理·cann
打通 AI 与信号处理的“任督二脉”:Ascend SIP Boost 加速库深度实战目录前言一、 SIP Boost:让 NPU 变身超级 DSP二、 核心武器库:覆盖三大核心领域三、 代码实战:像写 C++ 一样写 NPU 信号处理
较劲男子汉1 小时前
运维·服务器·数据库·cann
CANN Runtime零拷贝传输技术源码实战 彻底打通Host与Device的数据传输壁垒在我们折腾AI模型加速的时候,往往把目光聚焦在算子优化、模型压缩上,却偏偏忽略了一个看似简单却极易成为性能瓶颈的环节——数据在Host(CPU)和Device(NPU)之间的搬运。今天,咱们就深入CANN的ops-nn仓库,扒一扒Runtime里零拷贝(Zero-Copy) 传输技术的实现老底,看看华为的大佬们是如何用共享内存和内存映射这些“老手艺”来玩出花样的,实现数据传输的“静默无声”与“极致速度”。
心疼你的一切1 小时前
数据仓库·人工智能·深度学习·aigc·智慧城市·cann
昇腾CANN实战落地:从智慧城市到AIGC,解锁五大行业AI应用的算力密码昇腾CANN(Compute Architecture for Neural Networks)并非停留在技术文档中的抽象框架,而是已经深度渗透到智慧城市、医疗、工业、AIGC等核心领域的“算力引擎”。它通过屏蔽底层硬件复杂度、优化AI算子性能、适配大模型场景,成为国产化AI应用落地的核心支撑。本文将聚焦CANN在四大典型行业的真实落地案例,拆解其技术实现路径与业务价值,让你直观看到CANN如何将“芯片算力”转化为“业务成果”。 cann组织链接 ops-nn仓库链接
哈哈你是真的厉害1 小时前
aigc·cann
当 Triton 遇上 Ascend:深度解析 GE Backend 如何打通 NPU 推理“最后一公里”目录一、 什么是 GE Backend?—— 架构中的“翻译官”二、 版本高光:v2.3.0 带来了什么?
心态还需努力呀1 小时前
分布式·cann
CANN仓库通信库:分布式训练的梯度压缩技术cann组织链接:https://atomgit.com/cannops-nn仓库链接:https://atomgit.com/cann/ops-nn
那个村的李富贵1 小时前
人工智能·算法·aigc·cann
CANN加速下的AIGC“即时翻译”:AI语音克隆与实时变声实战摘要:本文以华为CANN(Compute Architecture for Neural Networks)仓库的实时推理优化能力为背景,聚焦AIGC领域极具应用价值的语音克隆与实时变声场景。通过一个完整的实时语音处理系统实现,深度解析CANN如何通过算子编译优化、内存零拷贝、流水线并行等技术,将AI语音模型的推理延迟从秒级压缩至毫秒级,实现“说话即变声”的沉浸式体验。文章包含完整的系统架构、核心代码解析及性能对比数据,为AIGC实时应用开发者提供实用技术参考。 cann组织链接 ops-nn仓库链接
wuli_滔滔1 小时前
cann
CANN仓库依赖管理 第三方库集成与版本控制策略分析本文深入剖析CANN项目在第三方库依赖管理上的工程实践,基于ops-nn仓库的依赖管理架构,解析多平台兼容的依赖解决方案。重点分析protobuf、glog、gtest等核心依赖的集成策略,探讨大型AI项目如何平衡依赖稳定性与开发灵活性。文章包含完整的依赖管理实战示例、企业级最佳实践和性能优化技巧,为复杂项目依赖管理提供可复用的方法论。
那个村的李富贵2 小时前
人工智能·ai作画·cann
从CANN到Canvas:AI绘画加速实战与源码解析摘要:本文以华为CANN(Compute Architecture for Neural Networks)仓库的模型优化能力为背景,结合AIGC领域最热门的AI绘画应用场景,通过一个完整的AI绘画加速实战项目,展示如何利用CANN优化模型推理性能。文章包含完整的代码实现、性能对比数据以及技术原理解析,为AIGC开发者提供实用的技术参考。 cann组织链接 ops-nn仓库链接
熊文豪2 小时前
foreach·cann·ops-nn
基于CANN的ops-nn Foreach批量算子解析与应用cann组织链接:https://atomgit.com/cann ops-nn仓库链接:https://atomgit.com/cann/ops-nn
小镇敲码人2 小时前
华为·cann·ops-nn
探索华为CANN框架中的Ops-NN仓库更多CANN组织详情:https://atomgit.com/cann Ops-NN仓库:https://atomgit.com/cann/ops-nn
结局无敌2 小时前
人工智能·cann
构建百年工程:cann/ops-nn 的可持续演进之道在开源世界中,一个项目能否长久生存,往往不取决于其初始功能的炫酷程度,而在于其可持续演进的能力。对于像 cann/ops-nn 这样承载着数千个高性能算子、服务于全球昇腾AI生态的核心基础设施而言,这一挑战尤为严峻。它不仅要应对硬件架构的快速迭代、AI算法的日新月异,还要管理来自内部团队和外部社区的海量贡献。如何避免代码腐化、技术债堆积和社区分裂,从而构建一个“百年工程”?cann/ops-nn 通过一套融合了先进软件工程理念与务实社区治理策略的体系,给出了令人信服的答案。
MSTcheng.2 小时前
人工智能·cann
CANN算子开发新范式:基于ops-nn探索aclnn两阶段调用架构在当前AI模型日益复杂、计算需求不断攀升的背景下,底层算子库的性能与易用性成为决定整体推理与训练效率的关键因素。CANN(Compute Architecture for Neural Networks)作为一套面向神经网络的异构计算架构,通过模块化设计和软硬协同优化,为开发者提供了高效、灵活的算子开发与调用能力。其中,ops-nn 仓库作为CANN生态中核心的神经网络类算子库,不仅封装了大量深度优化的基础算子,还引入了一种全新的 aclnn 两阶段调用架构,显著提升了算子使用的灵活性与执行效率。
一枕眠秋雨>o<3 小时前
cann
编译的炼金术:cann-compiler如何将计算图点石成金在AI系统的全栈架构中,编译器常被视作“幕后工匠”——它默默将高层框架的计算图转化为硬件可执行的指令序列,却极少获得与模型架构同等的关注。然而,当千亿参数模型需要在昇腾NPU上实现90%以上的硬件利用率时,编译器的优化能力直接决定了算力释放的上限。华为昇腾CANN架构中的cann-compiler仓库,正是一套将“算法意图”精准映射至“硬件行为”的编译炼金术。它不仅关乎性能,更关乎计算语义的保真度——在算子融合、内存复用、指令调度的复杂权衡中,如何确保优化后的执行结果与原始计算图数学等价,成为AI编译器的
深鱼~3 小时前
人工智能·深度学习·transformer·cann
ops-transformer算子库:解锁昇腾大模型加速的关键在大模型时代,Transformer架构成为自然语言处理、计算机视觉、多模态融合等领域的核心基础,但其动辄数十亿、上百亿的参数量带来了巨大的计算开销,对硬件算力和底层算子优化提出了极高要求。CANN(Compute Architecture for Neural Networks)作为华为面向AI场景打造的异构计算架构,是昇腾AI处理器发挥极致算力的核心支撑,而ops-transformer算子库作为CANN生态中专为Transformer大模型打造的专用算子库,针对Transformer的核心计算环节做
禁默3 小时前
深度学习·重构·aigc·transformer·cann
不仅是 FlashAttention:揭秘 CANN ops-transformer 如何重构大模型推理目录前言一、 击穿“长序列”瓶颈:FlashAttention 的原生进化二、 驾驭“稀疏计算”:MoE 的完整工具链
Neolnfra3 小时前
cann
深入解析CANN架构下AIGC算子开发:从原理到Ascend C实战CANN组织链接:https://atomgit.com/cann ops-nn仓库链接:https://atomgit.com/cann/ops-nn 在AIGC(人工智能生成内容)时代,算子作为AI计算的最小原子操作单元,其性能直接影响生成式模型的推理与训练效率。华为CANN(Compute Architecture for Neural Networks)作为连接上层AI框架与底层昇腾AI处理器的桥梁,通过开源开放为开发者提供了多层次算子开发路径。本文将深入剖析CANN架构下AIGC算子的开发原理,
向哆哆3 小时前
cann
CANN生态实践指南:基于custom-op构建高性能自定义算子cann组织链接:https://atomgit.com/cann ops-nn仓库链接:https://atomgit.com/cann/ops-nn
熊文豪3 小时前
cann·ops-nn
CANN算子库ops-nn中的优化器算子技术详解cann组织链接:https://atomgit.com/cann ops-nn仓库链接:https://atomgit.com/cann/ops-nn
熊文豪3 小时前
cann·ops-nn
CANN ops-nn算子融合技术深度剖析与实践cann组织链接:https://atomgit.com/cann ops-nn仓库链接:https://atomgit.com/cann/ops-nn
向哆哆4 小时前
架构·cann
CANN生态深度解析:ops-nn仓库的核心架构与技术实现在人工智能(AI)快速发展的今天,高效的计算引擎和算子库成为了AI应用落地的关键支撑。CANN(Compute Architecture for Neural Networks)作为一个开源的异构计算架构,为AI模型的训练和推理提供了强大的底层支持。其中,ops-nn仓库作为CANN生态中的核心组成部分,专注于神经网络算子的实现与优化,是构建高性能AI计算系统的重要基石。