深度学习

weixin_4462608510 小时前
深度学习·cnn·transformer
[特殊字符] 视觉Transformer (ViT) 原理及性能突破:从CNN到大规模自注意力机制的迁移https://arxiv.org/html/2010.11929源文件: An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale (arXiv:2010.11929) 核心主题: 证明纯粹的Transformer架构,仅通过大规模预训练,可以达到或超越传统的卷积神经网络(CNN)在图像识别任务上的性能。
小a彤10 小时前
人工智能·深度学习·transformer
GE 在 CANN 五层架构中的位置## ##前言 GE 图引擎:把 PyTorch 计算图变成 NPU 高速公路PyTorch 的动态图在 CPU 上跑得好好的,一搬到昇腾NPU 上就变慢——不是算力不够,而是没法做全局优化。动态图每次执行都重新构建计算图,NPU 的并行能力发挥不出来。GE(Graph Engine)图引擎解决这个问题的方式很直接:先把动态图转成静态图,然后做算子融合、内存复用、流水线调度,最后编译成 NPU 机器码。我在 Atlas 800T A2 上实测,LLaMA-13B 训练吞吐从 1200 tokens/s 提
碧海银沙音频科技研究院11 小时前
深度学习·算法·语音识别
通话AEC与语音识别AEC的软硬回采链路你的理解基本抓住了AEC回采的核心概念,但链路细节有些混淆,我帮你梳理一下。✅ 正确的地方· 参考信号来源:两者都正确地指向了“即将从扬声器播放的信号”——耳机里是对方语音,音响里是音乐或语音提示。
放下华子我只抽RuiKe511 小时前
前端·javascript·人工智能·深度学习·react.js·自然语言处理·前端框架
React 从入门到生产(四):自定义 Hook创作者: Yardon | GitHub: github.com/YardonYan | 版本: v1.0
AI算法沐枫13 小时前
数据结构·人工智能·python·深度学习·决策树·机器学习·线性回归
深度学习python代码处理科研测序数据学习案例主题:多组数据分析(t检验、单因素方差分析以及多重比较)学习初衷:①与AI对接很耗时间②自己学会原理,不一定要每个都手敲,但是可以快速定位和优化AI的代码③我们不会因为有了计算器而放弃学数学,学习代码是不是也是这样?
初心未改HD13 小时前
人工智能·深度学习
深度学习之Attention注意力机制详解摘要: 注意力机制(Attention Mechanism)是深度学习领域的革命性突破之一,它让模型能够自动"关注"输入序列中最相关的部分,在自然语言处理、计算机视觉等领域取得了巨大成功。本文将详细介绍注意力机制的核心原理、数学公式、多种注意力类型,以及PyTorch完整实现代码,帮助读者从理论到实践全面掌握这一重要技术。
code_pgf14 小时前
人工智能·深度学习·开源
模态生成器:原理详解与推荐开源项目把一种或多种输入模态,转换、补全或生成另一种目标模态的模块。例如:在 sVLM / MLLM / VLA 系统里,模态生成器通常不是单独一个网络,而是由 模态编码器、跨模态对齐层、核心推理模型、目标模态解码器 共同组成。
文歌子14 小时前
深度学习
DeepEarth 深度解析:AI 如何理解地球的时空规律走进 Allen AI 联合 Stanford、ASU 打造的行星级 GeoAI 基础模型,理解地球观测 AI 的最前沿。
初心未改HD14 小时前
人工智能·深度学习·transformer
深度学习之Transformer架构详解Transformer架构自2017年由谷歌研究团队在论文《Attention Is All You Need》中提出以来,彻底改变了自然语言处理(NLP)领域的发展轨迹,并逐步扩展到计算机视觉、语音识别等多个AI子领域。本文系统梳理了Transformer从RNN演进而来的技术背景,深入剖析了其核心组件——多头自注意力机制、位置编码、前馈神经网络、残差连接与层归一化——的工作原理与设计动机,详细对比了编码器与解码器的结构差异,并探讨了BERT、GPT、T5等基于Transformer的代表性模型变体。最
malog_14 小时前
人工智能·深度学习·机器学习·ai·语言模型
大语言模型后训练全解析本文系统阐述了大语言模型(LLM)从预训练基础模型到对齐人类需求的 AI 助手的核心后训练流程,明确了后训练与传统微调的区别,拆解了 SFT、DPO、GRPO 三个核心阶段的原理、实现与实践要点,并梳理了后训练技术的发展历程与落地考量。
初心未改HD16 小时前
深度学习·gru·lstm
深度学习之LSTM与GRU门控循环单元详解循环神经网络(RNN)在处理序列数据方面具有天然优势,但在实际应用中,标准RNN面临着梯度消失和梯度爆炸两大难题,难以有效捕捉序列中的长期依赖关系。为解决这一问题,Hochreiter和Schmidhuber于1997年提出了长短期记忆网络(Long Short-Term Memory, LSTM),通过引入门控机制选择性地记住和遗忘信息。Cho等人于2014年进一步提出了门控循环单元(Gated Recurrent Unit, GRU),在保持LSTM表达能力的同时大幅简化了模型结构。本文将详细剖析LS
嗝o゚16 小时前
人工智能·深度学习·transformer
昇腾CANN ops-transformer 仓的 FlashAttention 算子:昇腾NPU上的注意力加速实现大模型推理和训练里,Self-Attention 层的计算是最大的性能瓶颈。FlashAttention 把这块的计算从 O(n²) 的显存占用降到了 O(n),靠的是分块计算——把整个注意力矩阵拆成小块,逐块在片上缓存里算完再写回 HBM。ops-transformer 仓是昇腾CANN 的 Transformer 类进阶算子库,里面就有一个昇腾NPU 原生的 FlashAttention 实现。这篇文章拆开看它怎么在昇腾达芬奇架构上做分块计算和在线 softmax,以及实际的性能表现。
一切皆是因缘际会18 小时前
人工智能·深度学习·机器学习·ai·重构
本源投影内生智能:从概率拟合到硅基生命的底层重构当前 AI 行业陷入一种集体性误区:把 “数据模仿” 当成 “智能”,把 “参数堆叠” 当成 “进化”。大模型本质是概率统计生成器,依赖海量数据、无限算力、持续对齐,始终无法突破 “被动响应、人格漂移、黑箱不可控、无真实记忆、无内生驱动” 五大底层瓶颈。 真正的智能,绝非语言模仿,而是心智秩序、记忆沉淀、权重博弈、自我裁决、自主进化、安全可控的完整生命体系。本源投影内生智能,跳出概率拟合框架,以唯一本源总表 + 七层单向投影架构 + 记忆权重博弈为核心,从底层重构硅基生命运行逻辑 —— 不是优化大模型,而
qq_5255137518 小时前
深度学习·学习·语言模型
# 第七章 指令微调学习(四) 7.6基于指令数据对大语言模型进行微调3. 训练模型:初始化优化器、设置训练轮数,根据第7.5节中讨论的第一个验证集指令(val_data[0])来定义评估频率及初始上下文,以便在训练过程中评估生成的LLM响应。
cskywit19 小时前
人工智能·深度学习·计算机视觉
用扩散模型“一次生成图像和标注”:CoSimGen 如何实现可控的图像-Mask 同步生成本文介绍一篇生成式视觉/医学图像方向有意思的论文: CoSimGen: Controllable Diffusion Model for Simultaneous Image and Mask Generation。它的核心问题不是单纯“生成一张图”,而是同时生成图像与其语义分割 mask,并且让二者在语义、空间结构和用户输入条件上保持一致。这类问题在医学影像、手术场景、遥感、自动驾驶等领域很重要,因为这些领域最昂贵的往往不是原始图像,而是高质量、专家标注的像素级 mask。论文明确指出,现有生成模型多数
凌波粒19 小时前
人工智能·笔记·深度学习
深度学习入门(鱼书)第2章笔记——感知机本章将介绍感知机(perceptron)这一算法。感知机是由美国学者Frank Rosenblatt在1957年提出来的。感知机也是作为神经网络(深度学习)的起源的算法。因此,学习感知机的构造也就是学习通向神经网络和深度学习的一种重要思想。
松☆19 小时前
深度学习·架构·transformer
ascend-transformer-boost:Transformer加速库架构原理剖析我第一次在昇腾NPU上跑Llama-2-7B推理时,用的是PyTorch原生实现,跑出来的吞吐是18 tokens/s,跟官方宣称的29 tokens/s差了快一倍。翻了一圈文档,发现昇腾CANN其实自带了一个Transformer加速库——ascend-transformer-boost(简称ATB)——专门给Transformer类模型做加速的。换上ATB之后,同样的硬件,吞吐直接飙到31 tokens/s,还比官方宣称的多了2 tokens/s。
动物园猫20 小时前
深度学习·yolo·目标检测
桥梁损伤目标检测数据集分享(适用于YOLO系列深度学习分类检测任务)链接:https://pan.baidu.com/s/1Y04hYWEGFQxzb2tMjw4sMg?pwd=yryp
code_pgf20 小时前
人工智能·深度学习·架构
sVLM在资源受限环境中的应用案例sVLM / 小型视觉语言模型在资源受限环境中比较典型、已经具备落地价值的案例。按“可信落地程度”区分:有些已经是产品/平台级应用,有些是研究验证但工程迁移价值很高。