昇腾

昇腾CANN1 天前
人工智能·昇腾·cann
芯模赋能,智启未来:杭电CANN启航营圆满收官,解锁AI实践5月17日晚,随着最后一行代码在昇腾NPU算力平台上成功运行,为期两天(5月16日-17日)的杭电CANN启航营在热烈的交流氛围中圆满落下帷幕。本次活动由杭州电子科技大学计算机学院、CANN开源社区与SwanLab开源社区联合打造,旨在将“产业前沿”第一时间引入课堂。同学们在下沙校区计算机学院1教115教室,共同经历了一场从底层算子开发到大语言模型微调的“硬核”技术之旅,实现了从理论学习到工程实践的深度跨越。
昇腾CANN6 天前
人工智能·昇腾·cann
5月14号直播丨多模态生成技术优化实践第二期--并行和Cache篇
蛐蛐蛐8 天前
人工智能·python·昇腾
昇腾910B4上安装新版本CANN的正确流程准备用vLLM-Ascend部署一下Qwen 3.6,其实也有其他朋友介绍了基本的流程:https://blog.csdn.net/weixin_45724433/article/details/160470026
昇腾CANN9 天前
人工智能·昇腾·cann
5月12日直播丨Ascend 950 HiF8模型量化技术的训推实践随着大模型训推规模持续增长,8-bit 数据格式已成为提升计算效率、降低显存占用和优化部署成本的重要方向。HiFloat8(HiF8)凭借大动态范围和灵活的精度表达,为大模型在低比特场景下兼顾精度与性能提供了新的路径。
昇腾CANN10 天前
人工智能·昇腾·cann·deepseek
5月11日直播丨CANN算子挑战赛(江山赛区)赛题和评分规则解读
昇腾CANN11 天前
人工智能·昇腾·cann
CANNBot + DeepSeek-V4 实操:30 分钟生成可达理论性能极限的 MXFP8 Matmul + Add 融合算子DeepSeek-V4 在通用编程领域表现惊艳,但当场景转向 NPU Ascend C 融合算子开发——这类高度依赖硬件架构知识和性能调优经验的垂直领域时,它的表现又会如何?本文基于 CANNBot + DeepSeek-V4,以大模型场景中广泛采用的 MXFP8 MatMul + Add 场景为例,端到端自动生成了融合算子工程生成并完成了精度、性能测试。核心成果如下:
嵌入式小企鹅12 天前
学习·开源·ai编程·risc-v·昇腾·deepseek v4
国产算力突破、RISC-V车规生态成型、AI编程工具免费化浪潮目录🔮 技术观察🧠 一、国产算力:DeepSeek V4全栈适配国产芯片🖥️ 二、RISC-V生态:车规芯片与安全软件双突破
大数据在线20 天前
cuda·昇腾·cann·英伟达·deepseek
AI计算新生态:旧地图找不到新大陆沿着旧地图,永远找不到新大陆。当英伟达GPU+CUDA花费数年构筑起足够高的AI计算生态壁垒时,试图通过“抄作业”的方式固然短时间之内可获得一定的份额,但这种“亦步亦趋”的捷径,本质上是基于他人的生态,最终无法在市场中实现真正的突围。
昇腾CANN20 天前
开发语言·javascript·性能优化·昇腾·cann
TileLang-Ascend 算子性能优化方法与实操在 AI 大模型时代,算子性能优化是提升整体训练和推理效率的关键。TileLang 是一门面向高性能算子开发的领域特定语言(DSL),采用简洁直观的编程范式,让开发者能够以接近数学表达的方式描述计算逻辑。相比传统的手写算子开发,TileLang 大幅降低了开发门槛,使开发者能够更高效地完成高性能算子的开发与调优。
嵌入式小企鹅21 天前
人工智能·学习·开源·嵌入式·小米·算力·昇腾
CPU供需趋紧、DeepSeek V4全链适配、小米开源万亿模型目录🔮 今日技术观察🧠 一、CPU供需趋紧 × 价格持续上行🖥️ 二、RISC-V生态 × 高性能MCU加速落地
是Yu欸22 天前
android·数据库·大模型·github·昇腾·sglang·qwen3
SGLang 推理服务基础性能评测版权声明:本文为原创,遵循 CC 4.0 BY-SA 协议。转载请注明出处。SGLang 推理服务基础性能评测
昇腾CANN23 天前
人工智能·昇腾·cann·deepseek
4月28日直播丨基于TorchTitan的DeepSeek-V4昇腾续训练优化实践
x_lrong24 天前
微调·部署·昇腾·ascend·llamafactory·qwen3·vllm-ascend
昇腾Ascend环境微调部署Qwen3(LlamaFactory+vLLM-Ascend)环境介绍:GitCode:实例:NPU basic · 1 * NPU 910B · 16v CPU · 64GB
昇腾CANN25 天前
人工智能·昇腾·cann·deepseek
【DeepSeek-V4昇腾首发系列干货】NPU DeepSeek-V4推理优化实践原文链接(链接跳转异常请到原文中查看):NPU DeepSeek-V4推理优化实践 直播回放链接:DeepSeek-V4昇腾首发:基于CANN的训推优化实践 DeepSeek团队发布了最新的模型DeepSeek-V4系列模型,包含DeepSeek-V4 Flash和DeepSeek-V4 Pro两种规格。在DeepSeek-V3.2的稀疏Attention(DeepSeek Sparse Attention)的基础上,在不同层间进一步通过KV Cache滑窗 (Window Cache) 和压缩算法 (K
昇腾CANN1 个月前
人工智能·昇腾·cann
CANN NEXT系列干货:CANN算子开发体验升级系列直播回放及材料链接:CANN - 开源代码托管,代码协作 - AtomGit | GitCode以前写算子要走写‑跑‑调‑测四步循环,常常调半天也达不到性能要求。 这次 CANN 把算子编程、运行时调度、性能调优三个环节一次性升级,助力开发者体验升级:
Zain Lau1 个月前
人工智能·昇腾·310p·华为昇腾推理芯片
华为昇腾310P废物利用——大模型推理服务注:310P不支持bf16、W4A4 带宽200G,双芯版的300I duo, 有48g和96g两种 目前市面上所有昇腾的卡均不支持FP8
嵌入式小企鹅1 个月前
人工智能·学习·开源·嵌入式·模型·半导体·昇腾
Kimi K2.6开源对标GPT-5.4、英飞凌AURIX拥抱RISC-V、工信部定调太空算力今天几条关键信号值得程序员关注:1️⃣ 月之暗面开源Kimi K2.6模型——首个国产开源模型在软件工程领域登顶全球,长程编码能力显著提升,支持300个子Agent并行执行4000步任务,持续编码最长超12小时
wei_shuo1 个月前
昇腾·cann
玩转昇腾 CANN:从 Hello World 到向量归一化的 Host–NPU 异构计算实战昇腾 CANN 一直被认为门槛高、资料散、难上手,但真正拦住新手的,并不是算子本身,而是对 Host 与 NPU 异构计算流程不清晰。本文基于 GitCode Notebook 的真实昇腾 NPU 环境,从 CANN 是什么、怎么跑起来讲起,通过 Hello World、数组加法到向量归一化三个最小可运行示例,完整演示 CPU 数据准备 → NPU 内存管理 → 数据传输 → 计算流程演示 → 结果回传 的全流程,帮助新手在 5 分钟内建立对 CANN 的正确认知,真正迈出昇腾异构计算的第一步。
WAIT_TIME1 个月前
docker·容器·昇腾·runtime·虚拟显卡·vnpu
昇腾910B虚拟卡(vNPU)创建以及Docker挂载物理挂载模式: 普通 Docker 模式(必须配合 --device), 如果你不依赖高级 Runtime,完全手动挂载。
昇腾CANN1 个月前
人工智能·昇腾·cann
码力全开特辑直播预告|4月20日19:00,PyPTO Tensor编程范式介绍【昇腾CANN】视频号、B站昇腾社区多平台直播点击“https://gitcode.com/cann/cann-learning-hub/issues/18?sessionid=”,参与互动赢取惊喜定制礼