ascendc

被制作时长两年半的个人练习生3 个月前
人工智能·bug·算子开发·ascendc
【AscendC】tiling方案设计不当引起的一个时隐时现的bug在设计tiling方案时,通常会考虑到非对齐的场景,对输入数据进行补全操作从而使得非对齐场景也能正确的完成计算。但在某些算子的实现过程中,沿用上述操作却会造成数据的错误计算,且这种错误出现与否取决于随机生成的测试数据质量。本文笔者记录一个典型的错误,并分析产生该错误的原因。
被制作时长两年半的个人练习生3 个月前
人工智能·算子开发·ascendc
【AscendC】ReduceSum中指定workLocal大小时如何计算参考官方文档,但其中对于workLocal大小的计算只是以代码注释的方式给出,不具有直观性,现在结合两个官方例子进行推导。 首先注意到api的调用,分为高维切分模式和指定数量模式,两种模式的计算是不同的,主要在于repeattimes这个变量的大小。
zjun30215 个月前
c++·人工智能·华为·昇腾·cann·ascendc
什么是CANN和Ascend C异构计算架构CANN(Compute Architecture for Neural Networks)是华为针对AI场景推出的异构计算架构,向上支持多种AI框架,包括MindSpore、PyTorch、TensorFlow等,向下服务AI处理器与编程,发挥承上启下的关键作用,是提升昇腾AI处理器计算效率的关键平台。同时针对多样化应用场景,提供多层次编程接口,支持用户快速构建基于昇腾平台的AI应用和业务。
被制作时长两年半的个人练习生5 个月前
1024程序员节·ascendc
【AscendC算子开发】笔记2 算子高级开发和调试调优Tensor也可以通过特定的printf方法来打印,见上图。 gdb调试见上图。为什么gdb调试无法成功,因为run.sh里面有两行export,如果直接通过.XX运行的话需要配置一下。 npu域也支持调试,可以使用上述的方法。 内存检测工具见上图。