深度学习

手写码匠2 小时前
人工智能·深度学习·算法·aigc
深入解析大模型架构之争:全能通用模型 vs 领域专精模型"大模型到底应该走通才路线还是专才路线?"——这是 2025 年以来 AI 领域最激烈的话题之一。一方面,以 GPT-4o、Claude 3.5、Gemini 2.0 为代表的通用大模型不断刷新综合能力边界,从编程到写作、从数学到多模态,一个模型覆盖数百种任务。另一方面,以 DeepSeek-Coder、Med-PaLM、BloombergGPT 为代表的领域专精模型在垂直场景中展现出通用模型难以企及的表现。
L、2185 小时前
深度学习·性能优化·transformer
CANN ops-transformer 仓库详解:Transformer 算子的底层实现与性能优化前面写了 40 多篇,提到 Transformer 的地方不少,但还没系统讲过 CANN 里专门为 Transformer 优化的算子库——ops-transformer。这个仓库里藏着大模型在昇腾 NPU 上跑得快的真正秘密:Flash Attention、Rotary Embedding、RMSNorm、SwiGLU,这些都是大模型的"基础设施算子"。
嗝o゚5 小时前
pytorch·python·深度学习·cann·ge-pass
昇腾CANN ge 仓的图优化 Pass:哪些 Pass 真正影响推理性能你训练好一个模型,导出 ONNX,转成 CANN 的 OM 模型。推理时发现:延迟 89ms,吞吐只有 1200 samples/s。
L、2186 小时前
服务器·人工智能·深度学习
昇腾NPU性能调优Checklist——从“能跑“到“跑得快“的20步性能调优是一个系统化工程,不是靠玄学调参。这份Checklist将调优过程拆分为20个可执行的步骤,每步都有明确的判断标准、操作命令和避坑指南。
碧海银沙音频科技研究院6 小时前
深度学习·语音识别
恒玄bes2600WM+DSP蓝牙耳机项目bes2600WM+DSP蓝牙耳机项目
蓦然回首却已人去楼空6 小时前
人工智能·深度学习·自然语言处理
深度学习进阶:自然语言处理|4.1.2 QA|grads 列表与省略号 [...] 详解params 和 grads 是一一对应的列表:如果一层有两个参数,例如全连接层的 W 和 b:对应关系就是:
手写码匠6 小时前
人工智能·深度学习·算法·aigc
Android 17 适配实战指南:新特性解读、隐私变更与迁移全攻略2026 年,Android 17(API 36)正式发布。从 2008 年 Android 1.0 的初露锋芒,到如今 Android 17 的全面成熟,这个移动操作系统走过了近二十年的演进之路。每一次大版本更新,对开发者来说都是一场"适配大考"——从权限管理到渲染架构,从隐私保护到折叠屏优化,底层变更的涟漪效应波及到每一个应用。适配做得好,用户无感知;适配不到位,线上告警跑不停。
端平入洛6 小时前
人工智能·深度学习
单个感知机为何无法解决异或问题?本文从几何、数学证明、代码验证三个角度,彻底搞清楚这个深度学习史上最经典的问题。异或是一个逻辑运算,规则只有一句话:相同为 0,不同为 1。
AI医影跨模态组学7 小时前
人工智能·深度学习·机器学习·论文·医学·医学影像·影像组学
J Thorac Oncol(IF=20.8)广东省人民医院钟文昭教授团队:基于影像组学的支持向量机区分驱动肺腺癌进展的分子事件01文献信息本次分享的文献是由广东省人民医院肺癌研究所钟文昭教授团队联合华南理工大学医学院、广东省人民医院病理科、核医学科等多学科团队在2024年9月19日在《Journal of Thoracic Oncology》(中科院1区,IF=20.8)上发表的研究“Radiomics-Based Support Vector Machine Distinguishes Molecular Events Driving the Progression of Lung Adenocarcinoma”即基于影像组学
AI医影跨模态组学8 小时前
人工智能·深度学习·论文·医学·医学影像·影像组学
Radiol Artif Intell 中山大学肿瘤防治中心放疗科:基于连续MRI的深度学习模型预测局部晚期鼻咽癌患者生存期01文献信息本次分享的文献是由中山大学肿瘤防治中心放疗科联合华南理工大学附属第六医院、南方医科大学和云南大学等机构在2025年2月发表在《Radiology: Artificial Intelligence》(中科院1区,IF=13.2)上的研究“A Serial MRI–based Deep Learning Model to Predict Survival in Patients with Locoregionally Advanced Nasopharyngeal Carcinoma”即基于连续M
Daydream.V8 小时前
人工智能·深度学习
深度学习常见激活函数详解(Sigmoid/Tanh/ReLU/Leaky ReLU/Swish/GELU)优缺点+场景对比一、为什么神经网络需要激活函数?很多新手初学神经网络时会疑惑:为什么不能直接用线性层堆叠,一定要加激活函数?
生成论实验室9 小时前
数据结构·人工智能·深度学习·算法·语言模型
用事件关系网络重新理解AI(二):损失函数、优化器与深度学习的动力学在前两篇文章中,我用事件关系网络理论解释了自注意力机制、词向量、CNN、GAN、强化学习、Dropout和知识蒸馏这七项核心AI技术。这篇文章将继续这一工作,用同一个理论框架来重新审视深度学习中最基础、最底层、也最容易被忽视的七项技术——损失函数、优化器、残差连接、归一化层、Scaling Law、灾难性遗忘、RAG与提示工程。
徐安安ye10 小时前
python·深度学习·机器学习
FlashAttention长程依赖建模:局部+全局的Hybrid Spiral结构设计某团队在处理长文档(100K tokens)时发现一个问题:局部窗口Attention捕捉局部依赖很好,但长距离依赖(比如第一章的某个词和最后一章的呼应)完全丢失了。他们尝试用全局Token,但发现全局Token的容量有限,长距离信息仍然被稀释。
AI医影跨模态组学10 小时前
人工智能·深度学习·论文·医学·医学影像·影像组学
eClinMed 中国人民解放军总医院第五医学中心介入超声科:基于超声的可解释性机器学习模型用于≤3cm肝细胞癌分类的开发与验证01文献信息本次分享的文献是由中国人民解放军总医院第五医学中心介入超声科联合厦门大学附属翔安医院、南开大学医学院和福州市第一总医院超声科等55家医院在2025年2月在柳叶刀子刊《eClinicalMedicine》(中科院1区,IF=10.0)上的研究“Development and validation of an ultrasound-based interpretable machine learning model for the classification of ≤3 cm hepatocel
蓦然回首却已人去楼空10 小时前
人工智能·深度学习·自然语言处理
深度学习进阶:自然语言处理|4.2.3 QA|交叉熵、激活函数与 y − t:一套数学框架的三个侧面你的三个问题——“为什么都用交叉熵”、“sigmoid 和 softmax 有什么关系”、“y − t 是怎么来的”——答案是同一件事:
徐安安_ye110 小时前
人工智能·深度学习·机器学习
FlashAttention遇上旋转位置编码:RoPE是怎么跟注意力计算配合的?某团队在昇腾NPU上跑ChatGLM-6B,用FlashAttention加速推理。跑了一段时间后发现模型的旋转位置编码(RoPE)效果不对——输入"北京是中国的首都"和"中国的首都是北京",模型对这两个句子的注意力分布完全一样,没有体现出位置差异。
放下华子我只抽RuiKe510 小时前
前端·javascript·深度学习·react.js·前端框架·ecmascript·集成学习
React 从入门到生产(八):测试与部署创作者: Yardon | GitHub: github.com/YardonYan | 版本: v1.0
5008411 小时前
人工智能·深度学习·机器学习·性能优化·wpf
用 Ascend CL 从零写一个推理程序前言用 PyTorch 推理很简单,但生产环境里经常需要更底层的控制——比如 C++ 服务、嵌入式设备、或者极致的性能优化。这时候就要用 Ascend CL(Compute Language)直接调用 NPU。
Loli_Wolf11 小时前
人工智能·深度学习·算法·microsoft·ai·ai编程·harness
AI 原生研发闭环:从提需到线上监测,再自动回到提需过去两年,企业采用 AI 编码工具的主问题已经从“能不能补全代码”转向“能不能进入真实研发系统,并对结果负责”。单点 AI 助手提升的是局部效率:写代码、写测试、总结 PR、解释报错。AI 原生研发闭环要解决的是系统效率:从客户反馈、线上指标、产品洞察、PRD、技术方案、代码变更、测试评审、CI/CD、发布治理、线上观测、事故复盘,再把证据沉淀回下一轮需求。
MediaTea11 小时前
人工智能·pytorch·python·深度学习·transformer
DL:Transformer 的基本原理与 PyTorch 实现Transformer 是深度学习中最重要的模型结构之一。它最初用于自然语言处理任务,后来逐渐扩展到图像、语音、多模态、代码生成、推荐系统和强化学习等领域,成为现代大模型的核心基础结构。