技术栈
深度学习
空白诗
5 分钟前
深度学习
·
计算机视觉
·
stable diffusion
CANN ops-nn 算子解读:Stable Diffusion 图像生成中的 Conv2D 卷积实现
本文基于 CANN ops-nn 仓库中的 Conv2D 算子实现,解析其在 AIGC 图像生成场景(如 Stable Diffusion)中的核心作用与优化策略。
User_芊芊君子
1 小时前
人工智能
·
深度学习
·
神经网络
CANN图编译器GE全面解析:构建高效异构计算图的核心引擎
在现代深度学习框架中,计算图是表示和优化神经网络计算的核心抽象。计算图将复杂的神经网络分解为基本计算单元(算子)和数据流动(张量),通过图级别的优化实现显著的性能提升。
爱吃大芒果
1 小时前
人工智能
·
深度学习
·
神经网络
CANN神经网络算子库设计思路:ops-nn项目的工程化实现逻辑
在人工智能浪潮席卷全球的今天,算力已成为驱动AI发展的核心引擎。然而,要将庞大的计算任务高效地映射到专用硬件上,离不开底层软件栈的关键支撑。作为AI异构计算的核心架构,CANN 扮演着承上启下的核心角色。而 ops-nn,作为CANN中专门为神经网络计算提供基础算子的核心库,其设计与实现直接决定了NPU硬件的性能发挥上限与易用性。本文将深入解析ops-nn的工程化实现逻辑,揭示其如何通过精巧的架构设计,将NPU的澎湃算力安全、高效地释放给每一位开发者。
哈__
1 小时前
人工智能
·
深度学习
·
重构
CANN加速VAE变分自编码器推理:潜在空间重构与编码解码优化
变分自编码器(Variational Autoencoder,VAE)作为一种强大的生成模型,通过学习数据的潜在表示,实现了数据的高效压缩和生成。VAE在图像生成、数据压缩、异常检测等领域有着广泛的应用。VAE推理包含编码和解码两个过程,编码器将输入数据映射到潜在空间,解码器从潜在空间重构数据。这两个过程都涉及复杂的神经网络计算,计算量较大,推理速度慢。CANN针对VAE推理推出了全面的优化方案,通过编码器优化、解码器优化和潜在空间管理,显著提升了VAE推理的性能和质量。
觉醒大王
1 小时前
论文阅读
·
笔记
·
深度学习
·
考研
·
自然语言处理
·
html
·
学习方法
哪些文章会被我拒稿?
身为审稿人,这些稿我绝不通过2025年积攒了不少审稿任务,现在正式启动处理。审稿前我会先看期刊当期的选题指南,这会影响学术判断的倾向,而且每天审稿量有限,格式不规范、选题偏离的稿件很容易被优先筛掉,分享给萌新作者 一、先讲个多数作者不清楚的 “铁律”期刊可不是想录用多少就能录用多少! 我们这本JCR一区期刊,一定周期内录用率不能超17%! 2025年上半年咱们录用率冲到25% 结果2025年下半年基本全是拒稿,质量稍好的也只能给RR处理 毕竟录用率太高,期刊会跌落JCR一区行列 扎心真相:投稿时机真的超级
禁默
1 小时前
人工智能
·
深度学习
·
transformer
·
cann
Ops-Transformer深入:CANN生态Transformer专用算子库赋能多模态生成效率跃迁
目录前言一、先搞懂:Ops-Transformer是什么?(CANN生态+Transformer专用定位)
杜子不疼.
1 小时前
人工智能
·
深度学习
基于CANN GE图引擎的深度学习模型编译与优化技术
GE(Graph Engine)是CANN的核心图编译器和执行器,负责将深度学习计算图转换为高效的硬件执行计划。本文将深入解析GE的架构设计、图优化技术以及模型编译流程,帮助开发者理解和应用GE进行模型性能优化。
chaser&upper
1 小时前
人工智能
·
深度学习
·
神经网络
预见未来:在 AtomGit 解码 CANN ops-nn 的投机采样加速
我们已经优化了 AIGC 的方方面面,但还有一个根本性的物理瓶颈悬在头顶:自回归(Autoregressive)。
机器懒得学习
2 小时前
python
·
深度学习
·
金融
智能股票分析系统
> 作者: 机器懒得学习> 日期: 2025年2月6日> 版本: v38.0> 关键词: PyQt5, 股票分析, AI智能, 量化交易, 连板天梯
vx_biyesheji0001
2 小时前
大数据
·
爬虫
·
python
·
深度学习
·
django
·
毕业设计
·
echarts
豆瓣电影推荐系统 | Python Django 协同过滤 Echarts可视化 深度学习 大数据 毕业设计源码
博主介绍:✌全网粉丝10W+,前互联网大厂软件研发、集结硕博英豪成立工作室。专注于计算机相关专业项目实战6年之久,选择我们就是选择放心、选择安心毕业✌ > 🍅想要获取完整文章或者源码,或者代做,拉到文章底部即可与我联系了。🍅
饭饭大王666
3 小时前
人工智能
·
深度学习
·
transformer
当 AI 系统开始“自省”——在 `ops-transformer` 中嵌入元认知能力
cann组织链接:https://atomgit.com/cann ops-nn仓库链接:https://atomgit.com/cann/ops-nn
TechWJ
3 小时前
人工智能
·
深度学习
·
神经网络
·
cann
·
ops-nn
CANN ops-nn神经网络算子库技术剖析:NPU加速的基石
本文基于CANN开源社区的ops-nn仓库进行技术解读在深度学习领域,算子(Operator)是神经网络的基本计算单元。从简单的加减乘除到复杂的卷积池化,每一个网络层的计算都离不开算子的支撑。对于AI芯片来说,算子库的丰富程度和性能水平直接决定了其生态竞争力。
心疼你的一切
3 小时前
数据仓库
·
深度学习
·
aigc
·
cann
拆解 CANN 仓库:实现 AIGC 文本生成昇腾端部署
随着AIGC技术的普及,从模型训练到落地部署的“最后一公里”成为很多开发者的痛点——如何让AIGC模型高效跑在昇腾NPU上?CANN(Compute Architecture for Neural Networks)作为昇腾AI的核心计算架构,其开源仓库中封装了海量面向NPU的AI计算能力,是AIGC落地昇腾平台的关键。本文将从CANN仓库核心能力解读入手,手把手实现一个轻量化AIGC文本生成功能的NPU部署,让你快速掌握CANN+AIGC的实战精髓。 cann组织链接 ops-nn仓库链接
哈__
3 小时前
人工智能
·
深度学习
·
神经网络
CANN加速图神经网络GNN推理:消息传递与聚合优化
图神经网络(Graph Neural Networks,GNN)是一种处理图结构数据的深度学习模型,能够有效学习节点和图的表示。GNN在社交网络分析、推荐系统、分子性质预测、知识图谱等领域有着广泛的应用。GNN推理的核心是消息传递和特征聚合,需要处理节点间的复杂交互,计算复杂度高,推理速度慢。CANN针对GNN推理推出了全面的优化方案,通过消息传递优化、聚合优化和稀疏图计算优化,显著提升了GNN推理的性能和效率。
User_芊芊君子
3 小时前
人工智能
·
深度学习
·
神经网络
CANN_MetaDef图定义框架全解析为AI模型构建灵活高效的计算图表示
CANN组织链接: https://atomgit.com/cann metadef仓库链接: https://atomgit.com/cann/metadef
哈哈你是真的厉害
4 小时前
人工智能
·
深度学习
·
aigc
·
transformer
驾驭万亿参数 MoE:深度剖析 CANN ops-transformer 算子库的“核武库”
目录一、 为什么通用算子不够用了?二、 核心能力:四大“护法”算子三、 开发者宝典:从入门到调优四、 结语
心疼你的一切
4 小时前
数据仓库
·
深度学习
·
架构
·
aigc
·
cann
模态交响:CANN驱动的跨模态AIGC统一架构
清晨,一位设计师在构思产品宣传方案:一段文字描述、几张概念草图、背景音乐的旋律设想,还有理想中视频的节奏感。传统工作流需要设计师在不同软件间切换,协调多个专业人士——文案、画师、作曲、视频剪辑。今天,跨模态AIGC技术正在改变这一切:输入核心概念,AI便能协同生成所有相关素材。本文深入探索如何利用华为CANN架构,构建统一、高效的多模态生成系统,让创意在不同媒介间自由流淌。
小羊不会打字
4 小时前
c++
·
深度学习
CANN 生态中的跨框架兼容桥梁:`onnx-adapter` 项目实现无缝模型迁移
cann组织链接:https://atomgit.com/cann ops-nn仓库链接:https://atomgit.com/cann/ops-nn 在 AI 开发生态日益多元的今天,研究人员和工程师常使用 PyTorch、TensorFlow、MindSpore 等不同框架进行模型训练。然而,当需要将这些模型部署到基于 CANN 的 NPU 加速平台时,格式不兼容、算子缺失、精度损失等问题往往成为落地障碍。
白日做梦Q
4 小时前
python
·
深度学习
·
神经网络
·
目标检测
·
机器学习
Anchor-free检测器全解析:CenterNet vs FCOS
在目标检测领域,Anchor-based方法曾如“预制模板”般主导市场——通过手动设计大量锚框覆盖图像,再修正模板以匹配目标。但这种方式如同用固定尺码的模具生产零件,既依赖经验调参,又存在冗余计算、小目标适配差等痛点。为打破桎梏,Anchor-free(无锚框)思路应运而生,其中**CenterNet(中心点检测)** 与**FCOS(全卷积单阶段检测)** 作为两大主流范式,分别代表了“关键点驱动”与“像素级回归”的核心逻辑。本文将从原理对比、前沿改进、现存挑战三个维度,拆解两种模型的优劣与演进方向,助
饭饭大王666
4 小时前
深度学习
CANN 生态中的自动化测试利器:`test-automation` 项目保障模型部署可靠性
cann组织链接:https://atomgit.com/cann ops-nn仓库链接:https://atomgit.com/cann/ops-nn 在 AI 模型从研发走向生产的过程中,功能正确性与数值稳定性是不可妥协的底线。然而,由于硬件差异、算子实现变更、框架版本升级等因素,模型在 NPU 上的推理结果可能出现细微偏差甚至严重错误。如何系统化地验证成百上千个模型在不同输入条件下的行为?CANN 开源生态中的 test-automation 项目为此提供了完整的自动化测试解决方案。