深度学习

放下华子我只抽RuiKe524 分钟前
前端·javascript·人工智能·深度学习·react.js·自然语言处理·前端框架
React 从入门到生产(四):自定义 Hook创作者: Yardon | GitHub: github.com/YardonYan | 版本: v1.0
AI算法沐枫2 小时前
数据结构·人工智能·python·深度学习·决策树·机器学习·线性回归
深度学习python代码处理科研测序数据学习案例主题:多组数据分析(t检验、单因素方差分析以及多重比较)学习初衷:①与AI对接很耗时间②自己学会原理,不一定要每个都手敲,但是可以快速定位和优化AI的代码③我们不会因为有了计算器而放弃学数学,学习代码是不是也是这样?
初心未改HD2 小时前
人工智能·深度学习
深度学习之Attention注意力机制详解摘要: 注意力机制(Attention Mechanism)是深度学习领域的革命性突破之一,它让模型能够自动"关注"输入序列中最相关的部分,在自然语言处理、计算机视觉等领域取得了巨大成功。本文将详细介绍注意力机制的核心原理、数学公式、多种注意力类型,以及PyTorch完整实现代码,帮助读者从理论到实践全面掌握这一重要技术。
code_pgf3 小时前
人工智能·深度学习·开源
模态生成器:原理详解与推荐开源项目把一种或多种输入模态,转换、补全或生成另一种目标模态的模块。例如:在 sVLM / MLLM / VLA 系统里,模态生成器通常不是单独一个网络,而是由 模态编码器、跨模态对齐层、核心推理模型、目标模态解码器 共同组成。
文歌子3 小时前
深度学习
DeepEarth 深度解析:AI 如何理解地球的时空规律走进 Allen AI 联合 Stanford、ASU 打造的行星级 GeoAI 基础模型,理解地球观测 AI 的最前沿。
初心未改HD3 小时前
人工智能·深度学习·transformer
深度学习之Transformer架构详解Transformer架构自2017年由谷歌研究团队在论文《Attention Is All You Need》中提出以来,彻底改变了自然语言处理(NLP)领域的发展轨迹,并逐步扩展到计算机视觉、语音识别等多个AI子领域。本文系统梳理了Transformer从RNN演进而来的技术背景,深入剖析了其核心组件——多头自注意力机制、位置编码、前馈神经网络、残差连接与层归一化——的工作原理与设计动机,详细对比了编码器与解码器的结构差异,并探讨了BERT、GPT、T5等基于Transformer的代表性模型变体。最
malog_3 小时前
人工智能·深度学习·机器学习·ai·语言模型
大语言模型后训练全解析本文系统阐述了大语言模型(LLM)从预训练基础模型到对齐人类需求的 AI 助手的核心后训练流程,明确了后训练与传统微调的区别,拆解了 SFT、DPO、GRPO 三个核心阶段的原理、实现与实践要点,并梳理了后训练技术的发展历程与落地考量。
初心未改HD5 小时前
深度学习·gru·lstm
深度学习之LSTM与GRU门控循环单元详解循环神经网络(RNN)在处理序列数据方面具有天然优势,但在实际应用中,标准RNN面临着梯度消失和梯度爆炸两大难题,难以有效捕捉序列中的长期依赖关系。为解决这一问题,Hochreiter和Schmidhuber于1997年提出了长短期记忆网络(Long Short-Term Memory, LSTM),通过引入门控机制选择性地记住和遗忘信息。Cho等人于2014年进一步提出了门控循环单元(Gated Recurrent Unit, GRU),在保持LSTM表达能力的同时大幅简化了模型结构。本文将详细剖析LS
嗝o゚5 小时前
人工智能·深度学习·transformer
昇腾CANN ops-transformer 仓的 FlashAttention 算子:昇腾NPU上的注意力加速实现大模型推理和训练里,Self-Attention 层的计算是最大的性能瓶颈。FlashAttention 把这块的计算从 O(n²) 的显存占用降到了 O(n),靠的是分块计算——把整个注意力矩阵拆成小块,逐块在片上缓存里算完再写回 HBM。ops-transformer 仓是昇腾CANN 的 Transformer 类进阶算子库,里面就有一个昇腾NPU 原生的 FlashAttention 实现。这篇文章拆开看它怎么在昇腾达芬奇架构上做分块计算和在线 softmax,以及实际的性能表现。
一切皆是因缘际会7 小时前
人工智能·深度学习·机器学习·ai·重构
本源投影内生智能:从概率拟合到硅基生命的底层重构当前 AI 行业陷入一种集体性误区:把 “数据模仿” 当成 “智能”,把 “参数堆叠” 当成 “进化”。大模型本质是概率统计生成器,依赖海量数据、无限算力、持续对齐,始终无法突破 “被动响应、人格漂移、黑箱不可控、无真实记忆、无内生驱动” 五大底层瓶颈。 真正的智能,绝非语言模仿,而是心智秩序、记忆沉淀、权重博弈、自我裁决、自主进化、安全可控的完整生命体系。本源投影内生智能,跳出概率拟合框架,以唯一本源总表 + 七层单向投影架构 + 记忆权重博弈为核心,从底层重构硅基生命运行逻辑 —— 不是优化大模型,而
qq_525513757 小时前
深度学习·学习·语言模型
# 第七章 指令微调学习(四) 7.6基于指令数据对大语言模型进行微调3. 训练模型:初始化优化器、设置训练轮数,根据第7.5节中讨论的第一个验证集指令(val_data[0])来定义评估频率及初始上下文,以便在训练过程中评估生成的LLM响应。
cskywit8 小时前
人工智能·深度学习·计算机视觉
用扩散模型“一次生成图像和标注”:CoSimGen 如何实现可控的图像-Mask 同步生成本文介绍一篇生成式视觉/医学图像方向有意思的论文: CoSimGen: Controllable Diffusion Model for Simultaneous Image and Mask Generation。它的核心问题不是单纯“生成一张图”,而是同时生成图像与其语义分割 mask,并且让二者在语义、空间结构和用户输入条件上保持一致。这类问题在医学影像、手术场景、遥感、自动驾驶等领域很重要,因为这些领域最昂贵的往往不是原始图像,而是高质量、专家标注的像素级 mask。论文明确指出,现有生成模型多数
凌波粒8 小时前
人工智能·笔记·深度学习
深度学习入门(鱼书)第2章笔记——感知机本章将介绍感知机(perceptron)这一算法。感知机是由美国学者Frank Rosenblatt在1957年提出来的。感知机也是作为神经网络(深度学习)的起源的算法。因此,学习感知机的构造也就是学习通向神经网络和深度学习的一种重要思想。
松☆8 小时前
深度学习·架构·transformer
ascend-transformer-boost:Transformer加速库架构原理剖析我第一次在昇腾NPU上跑Llama-2-7B推理时,用的是PyTorch原生实现,跑出来的吞吐是18 tokens/s,跟官方宣称的29 tokens/s差了快一倍。翻了一圈文档,发现昇腾CANN其实自带了一个Transformer加速库——ascend-transformer-boost(简称ATB)——专门给Transformer类模型做加速的。换上ATB之后,同样的硬件,吞吐直接飙到31 tokens/s,还比官方宣称的多了2 tokens/s。
动物园猫9 小时前
深度学习·yolo·目标检测
桥梁损伤目标检测数据集分享(适用于YOLO系列深度学习分类检测任务)链接:https://pan.baidu.com/s/1Y04hYWEGFQxzb2tMjw4sMg?pwd=yryp
code_pgf9 小时前
人工智能·深度学习·架构
sVLM在资源受限环境中的应用案例sVLM / 小型视觉语言模型在资源受限环境中比较典型、已经具备落地价值的案例。按“可信落地程度”区分:有些已经是产品/平台级应用,有些是研究验证但工程迁移价值很高。
灰灰勇闯IT9 小时前
深度学习
ops-math 的 ReduceSum:Tensor 归约为什么是计算热点写 AI 训练代码时经常看到一个操作:loss = loss.sum() 或者 accuracy = (pred == label).sum()/len(label)。一个简单的归约求和,CPU 上几微秒的事。在 NPU 上"求和"这个操作不简单——Tensor 分布在 DDR 的不同位置上,把所有元素累加成一个标量需要精心设计的数据搬运策略。
陈天伟教授9 小时前
人工智能·深度学习
图解人工智能(32)深度学习前沿思考一下,序列到序列模型为什么难以处理过长的数据?注意力机制是如何解决这一问题的?标准序列到序列模型由一个编码器将输入序列压缩成一个定长向量,再由一个解码器生成输出序列。当输入序列过长时,定长向量无法承载这些信息,必然会有一些信息会损失,导致性能下降。
忆~遂愿9 小时前
人工智能·深度学习·目标检测·microsoft·机器学习·ar·交互
从文字应答到具象共情:Agent 交互的底层革新当大多数 Agent 还停留在文字匹配、机械应答的交互模式里,魔星云具身 Agent正以表情、手势与情绪联动,带来交互方式的本质改变 ——AI 不再是冰冷的信息输出工具,而是能读懂情绪、贴合语境、自然回应的交互伙伴,人机交互的底层逻辑正在悄然更新。