cann

华为云开发者联盟2 个月前
人工智能·昇腾·cann·算子优化·graph engine
深度解读昇腾CANN小shape算子计算优化技术,进一步减少调度开销本文分享自华为云社区《深度解读昇腾CANN小shape算子计算优化技术,进一步减少调度开销》,作者:昇腾CANN。
华为云开发者联盟3 个月前
大模型·昇腾·cann·华为云开发者联盟
深度解读昇腾CANN模型下沉技术,提升模型调度性能本文分享自华为云社区《深度解读昇腾CANN模型下沉技术,提升模型调度性能》,作者:昇腾CANN。AI模型的运行通常情况下需要CPU和NPU(昇腾AI处理器)等AI专用处理器协同工作,CPU所在位置称为主机端(Host),而NPU所在位置称为设备端(Device)。对于采用Host调度的AI模型来说,Host下发Task的时序和Device执行Task的时序是异步的,如果Device执行Task的速度比Host下发Task的速度快,则Device会处于空闲状态。比如,大模型场景的增量推理或训练的FineTu
华为云开发者联盟3 个月前
cann·华为云开发者联盟·华为云图引擎ges·多流并行
深度解读昇腾CANN多流并行技术,提高硬件资源利用率本文分享自华为云社区《深度解读昇腾CANN多流并行技术,提高硬件资源利用率》,作者:昇腾CANN。随着人工智能应用日益成熟,文本、图片、音频、视频等非结构化数据的处理需求呈指数级增长,数据处理过程从通用计算逐步向异构计算过渡。面对多样化的计算需求,昇腾AI处理器内置丰富的硬件计算资源用于处理不同的计算任务。其中,AI Core、Vector Core与AI CPU分别负责AI计算场景下的矩阵、向量与标量计算,DVPP支持图像、视频等数据的加速处理,而HCCL作为华为集合通信库,则提供单机多卡及多机多卡间的
qianbo_insist4 个月前
华为·cann
香橙派华为昇腾CANN架构编译opencv4.9为啥要编译opencv4.9.0, 因为在4.9.0 中增加了华为昇腾CANN的外接开发库,下图为盒子外观,此次一接到这个盒子,立刻开始开箱操作,首先就是要编译opencv4.9,以前在香橙派3588 的盒子中,也是同样的操作,不过当时编译的是4.6
华为云开发者联盟4 个月前
算子·昇腾·cann·华为云开发者联盟·ascend c
一文教你如何调用Ascend C算子本文分享自华为云社区《一文教你如何调用Ascend C算子》,作者: 昇腾CANN。Ascend C是CANN针对算子开发场景推出的编程语言,原生支持C和C++标准规范,兼具开发效率和运行性能。基于Ascend C编写的算子程序,通过编译器编译和运行时调度,运行在昇腾AI处理器上。使用Ascend C,开发者可以基于昇腾AI硬件高效实现自定义的创新算法。
华为云开发者联盟1 年前
算子·cann·算子开发·自定义算子
手敲,Ascend算子开发入门笔记分享本文分享自华为云社区《Ascend算子开发入门笔记》,作者: JeffDing 。Ascend C是CANN针对算子开发场景推出的编程语言,原生支持C和C++标准规范,最大化匹配用户开发习惯;通过多层接口抽象、自动并行计算、孪生调试等关键技术,极大提高算子开发效率,助力AI开发者低成本完成算子开发和模型调优部署。