cann

灰灰勇闯IT2 天前
人工智能·深度学习·算法·cann
MindSpore 和 CANN 是什么关系——用一个厨房讲明白想象你开了一家餐厅,要做一盘番茄炒蛋。你需要的不是一口锅,而是一整套东西:菜谱、切菜案板、燃气灶、锅铲、盘子。MindSpore 和 CANN 的关系差不多就是这样——MindSpore 管"做什么菜",昇腾CANN 管"用什么灶、怎么大火快炒"。
昇腾CANN3 天前
人工智能·昇腾·cann
芯模赋能,智启未来:杭电CANN启航营圆满收官,解锁AI实践5月17日晚,随着最后一行代码在昇腾NPU算力平台上成功运行,为期两天(5月16日-17日)的杭电CANN启航营在热烈的交流氛围中圆满落下帷幕。本次活动由杭州电子科技大学计算机学院、CANN开源社区与SwanLab开源社区联合打造,旨在将“产业前沿”第一时间引入课堂。同学们在下沙校区计算机学院1教115教室,共同经历了一场从底层算子开发到大语言模型微调的“硬核”技术之旅,实现了从理论学习到工程实践的深度跨越。
昇腾CANN8 天前
人工智能·昇腾·cann
5月14号直播丨多模态生成技术优化实践第二期--并行和Cache篇
昇腾CANN10 天前
人工智能·昇腾·cann
5月12日直播丨Ascend 950 HiF8模型量化技术的训推实践随着大模型训推规模持续增长,8-bit 数据格式已成为提升计算效率、降低显存占用和优化部署成本的重要方向。HiFloat8(HiF8)凭借大动态范围和灵活的精度表达,为大模型在低比特场景下兼顾精度与性能提供了新的路径。
昇腾CANN11 天前
人工智能·昇腾·cann·deepseek
5月11日直播丨CANN算子挑战赛(江山赛区)赛题和评分规则解读
昇腾CANN12 天前
人工智能·昇腾·cann
CANNBot + DeepSeek-V4 实操:30 分钟生成可达理论性能极限的 MXFP8 Matmul + Add 融合算子DeepSeek-V4 在通用编程领域表现惊艳,但当场景转向 NPU Ascend C 融合算子开发——这类高度依赖硬件架构知识和性能调优经验的垂直领域时,它的表现又会如何?本文基于 CANNBot + DeepSeek-V4,以大模型场景中广泛采用的 MXFP8 MatMul + Add 场景为例,端到端自动生成了融合算子工程生成并完成了精度、性能测试。核心成果如下:
大数据在线21 天前
cuda·昇腾·cann·英伟达·deepseek
AI计算新生态:旧地图找不到新大陆沿着旧地图,永远找不到新大陆。当英伟达GPU+CUDA花费数年构筑起足够高的AI计算生态壁垒时,试图通过“抄作业”的方式固然短时间之内可获得一定的份额,但这种“亦步亦趋”的捷径,本质上是基于他人的生态,最终无法在市场中实现真正的突围。
昇腾CANN22 天前
开发语言·javascript·性能优化·昇腾·cann
TileLang-Ascend 算子性能优化方法与实操在 AI 大模型时代,算子性能优化是提升整体训练和推理效率的关键。TileLang 是一门面向高性能算子开发的领域特定语言(DSL),采用简洁直观的编程范式,让开发者能够以接近数学表达的方式描述计算逻辑。相比传统的手写算子开发,TileLang 大幅降低了开发门槛,使开发者能够更高效地完成高性能算子的开发与调优。
昇腾CANN24 天前
人工智能·昇腾·cann·deepseek
4月28日直播丨基于TorchTitan的DeepSeek-V4昇腾续训练优化实践
昇腾CANN1 个月前
人工智能·昇腾·cann·deepseek
【DeepSeek-V4昇腾首发系列干货】NPU DeepSeek-V4推理优化实践原文链接(链接跳转异常请到原文中查看):NPU DeepSeek-V4推理优化实践 直播回放链接:DeepSeek-V4昇腾首发:基于CANN的训推优化实践 DeepSeek团队发布了最新的模型DeepSeek-V4系列模型,包含DeepSeek-V4 Flash和DeepSeek-V4 Pro两种规格。在DeepSeek-V3.2的稀疏Attention(DeepSeek Sparse Attention)的基础上,在不同层间进一步通过KV Cache滑窗 (Window Cache) 和压缩算法 (K
昇腾CANN1 个月前
人工智能·昇腾·cann
CANN NEXT系列干货:CANN算子开发体验升级系列直播回放及材料链接:CANN - 开源代码托管,代码协作 - AtomGit | GitCode以前写算子要走写‑跑‑调‑测四步循环,常常调半天也达不到性能要求。 这次 CANN 把算子编程、运行时调度、性能调优三个环节一次性升级,助力开发者体验升级:
wei_shuo1 个月前
昇腾·cann
玩转昇腾 CANN:从 Hello World 到向量归一化的 Host–NPU 异构计算实战昇腾 CANN 一直被认为门槛高、资料散、难上手,但真正拦住新手的,并不是算子本身,而是对 Host 与 NPU 异构计算流程不清晰。本文基于 GitCode Notebook 的真实昇腾 NPU 环境,从 CANN 是什么、怎么跑起来讲起,通过 Hello World、数组加法到向量归一化三个最小可运行示例,完整演示 CPU 数据准备 → NPU 内存管理 → 数据传输 → 计算流程演示 → 结果回传 的全流程,帮助新手在 5 分钟内建立对 CANN 的正确认知,真正迈出昇腾异构计算的第一步。
昇腾CANN1 个月前
人工智能·昇腾·cann
码力全开特辑直播预告|4月20日19:00,PyPTO Tensor编程范式介绍【昇腾CANN】视频号、B站昇腾社区多平台直播点击“https://gitcode.com/cann/cann-learning-hub/issues/18?sessionid=”,参与互动赢取惊喜定制礼
昇腾CANN1 个月前
昇腾·cann
CANN Meetup 北京站|本周六赴约!参会指南+直播预约,干货、福利双丰收备受期待的 CANN Meetup 北京站,将于本周六(4月18日)正式与大家见面!为了让每一位参会者都能轻松赴约、满载而归,这份超详细参会指南请务必收藏,从签到流程到会场细节,从干货议题到专属福利,一文读懂所有注意事项~
昇腾CANN1 个月前
昇腾·cann
4月15日直播丨CANNBot开发进阶:PyPTO算子开发实操进入社区互动讨论,获取往期材料,赢取社区好礼~https://gitcode.com/org/cann/discussions/80
昇腾CANN1 个月前
昇腾·cann
从微观到介观:MCE SIG突破算力瓶颈的DPD算子已开源从微观到介观:MCE SIG突破算力瓶颈的DPD算子已开源,化工行业深入介观尺度,持续完善AI+科学计算能力
昇腾CANN1 个月前
昇腾·cann
CANN NEXT系列干货:面向950的架构详解面向Ascend 950,CANN技术架构的变与不变当前,人工智能正以前所未有的速度渗透千行百业,推动 AI 算力需求呈指数级增长,算力已成为人工智能产业发展的核心竞争力。
昇腾CANN1 个月前
昇腾·cann
【CANNBot学习周】4.13~4.16入门课程来袭经历了上一期“CANNBot发布:畅享算子开发新体验”,相信你对解锁智能化昇腾CANN算子开发已经跃跃欲试。
红目香薰1 个月前
c语言·开发语言·华为·华为云·昇腾·cann·modelarts
Ascend C 算子:Sigmoid 函数原理深入解析与工程化构建及验证声明:本文所有内容均围绕Ascend C算子开发能力认证(中级)相关知识点进行考试心得分享,为保障考试的公平性,会对完整的流程、函数、逻辑、基础算法与代码进行说明,具体的合并组合方式需要理解后自行填充。
昇腾CANN2 个月前
昇腾·cann
4月3日直播丨CANNBot发布:畅享算子开发新体验CANN算子的"手工作坊"如何突围?当手写内核、反复调试、性能问题定位等成为效率瓶颈,AI开发正从"匠人单打独斗"迈向“智能工业化”。大模型时代更需注重算子的高效开发与快速定制,构建AI辅助的开发流水线。