深度学习

计算机科研狗@OUC几秒前
人工智能·深度学习·计算机视觉
(cvpr26) AIMDepth: Asymmetric Image-Event Mamba for Monocular Depth Estimation该论文研究事件相机+图像结合用于深度估计。如下图所示,当前方法包括隐式融合(多模态数据直接拼接输入编码器),显示融合(多模态分别提取特征,由融合模块融合特征),作者提出一种全新方案,输入数据先进行特征对齐(SCPG),同时构建非对称模态编码器(AME),然后中间进行模态交互局部细化(ModiLocal)。
Black蜡笔小新6 小时前
人工智能·深度学习
企业私有化AI训练推理一体工作站DLTM深度学习推理工作站全流程技术解析在数字化转型的浪潮中,AI已经成为企业提升竞争力的核心引擎,但如何构建一套“自主可控、安全可靠、易于落地”的AI体系,仍是多数企业面临的难题。DLTM企业级AI模型工作站,正是为解决这一痛点而生,为企业打造从数据到应用的全链路自主AI能力。
IRevers8 小时前
人工智能·pytorch·深度学习·大模型·datawhale·vllm·amdev
【大模型】Gemma4在ROCm和vLLM部署Gemma 4 是 Google DeepMind 于 2026 年 4 月推出的一系列最新、最强的开源大模型。它的定位非常明确:以极高的"参数效率"为核心,将强大的 AI 能力从云端带到你的手机、电脑等本地设备上。
装不满的克莱因瓶7 小时前
人工智能·pytorch·python·深度学习·机器学习·分类·数据挖掘
了解多标签图像分类方法——从Sigmoid输出到真实世界复杂视觉理解目录一、前言二、多标签图像分类的本质(一)任务定义(二)示例(三)核心区别三、多标签分类与多类别分类的本质区别
β添砖java7 小时前
深度学习
深度学习22GoogLeNet+数学归一化+ResNet+CPU,GPU....① 白色的卷积用来改变通道数,蓝色的卷积用来抽取信息。② 最左边一条1X1卷积是用来抽取通道信息,其他的3X3卷积用来抽取空间信息。
β添砖java3 小时前
人工智能·深度学习
深度学习(22)网络中的网络NiN① 在全局平均池化层(GAP)被提出之前,常用的方式是将feature map直接拉平成一维向量,但是GAP不同,是将每个通道的二维图像做平均,最后也就是每个通道对应一个均值。
YOLO数据集集合6 小时前
人工智能·深度学习·yolo·目标检测·无人机
无人机航拍地质灾害智能识别 山体滑坡实例分割数据集落地实战 | 泥石流监测 道路险情封堵 深度学习模型训练方案10296期#无人机巡检 #地质灾害AI预警 #山体滑坡识别 #实例分割 #深度学习数据集 #遥感影像解译 #泥石流监测 #道路滑坡检测 #模型训练实战 #灾害智能防控
Kobebryant-Manba3 小时前
人工智能·深度学习
深度学习时候d2l报错和使用问题目录报错解决:使用:解决AttributeError: module ‘d2l.torch‘ has no attribute ‘load_data_time_machine‘_attributeerror: module 'torch' has no attribute 'l-CSDN博客文章浏览阅读5.5k次,点赞8次,收藏3次。文章描述了在使用D2L库时遇到的AttributeError,原因在于使用的d2l版本过高。解决方法是通过pip将d2l降级到0.17.5版本。 https://blog.c
大模型最新论文速读4 小时前
论文阅读·人工智能·深度学习·机器学习·自然语言处理
06-16 · LLM 最新论文速览今日候选池 101 篇,硬过滤 + LLM 打分后通过评估 15 篇,精选 Top-10,另列 5 篇速览。
宝贝儿好5 小时前
人工智能·深度学习·神经网络·学习·算法·自然语言处理
【LLM】第二章:HuggingFace入门学习HuggingFace是一个提供开源预训练模型和相关工具链的平台,目前已经是一个完整的AI开发生态系统,支持NLP、计算机视觉、语音处理、多模态任务等多个领域。我们使用HF可以简化预训练模型的使用,加速项目的开发和落地。
Kobebryant-Manba6 小时前
深度学习·学习·gru
学习门控循环单元gru目录介绍门(相当于一个控制单元 值为0-1 注意力青春版)候选隐状态(重置门Rt发挥作用)隐状态(更新门Zt和候选隐状态H~t发挥作用)
装不满的克莱因瓶8 小时前
人工智能·python·深度学习·目标检测·机器学习·计算机视觉·目标跟踪
【工业领域】掌握非极大值抑制(NMS)目标检测后处理方法——从重复框消除到工程落地核心技术目录一、前言二、为什么需要NMS(一)模型输出特点(二)问题本质(三)工业后果三、NMS核心思想(一)一句话理解
ujainu小7 小时前
人工智能·深度学习·transformer
CANN ops-transformer:编译和运行 FlashAttention 示例随着大语言模型参数规模的爆炸式增长,Transformer 架构中 Self-Attention 机制的计算量和显存占用成为制约训练与推理效率的核心瓶颈。标准 Attention 的时间复杂度和空间复杂度均为 O(N^2),当序列长度达到 4096 甚至更长时,Q、K、V 矩阵的显存在 HBM 中会成为难以承受的负担。FlashAttention 通过分块计算(Tile)和算子融合(Kernel Fusion)技术,将显存占用从 O(N^2) 大幅削减至 O(N),同时保持数值精度与标准 Attentio
宝贝儿好7 小时前
人工智能·深度学习·机器学习·自然语言处理
【LLM】第一章:知识体系框架概览大模型,具体说就是大语言模型,LLM,large language model,这个领域其实就是NLP,所以本专栏也是NLP专栏的延续,是NLP的高阶内容。
盼小辉丶8 小时前
pytorch·python·深度学习·强化学习
PyTorch强化学习实战(14)——优先经验回放机制经验回放 (Experience Replay) 通过打破样本间的时序相关性,极大地稳定了训练过程,使深度Q网络 (Deep Q-Network, DQN) 能够从非平稳分布中高效学习。然而,传统经验回放采用均匀采样策略,对所有经验样本一视同仁,这引发了一个关键问题:是否所有经验都具有同等价值?2015 年,DeepMind 的研究团队发表了《Prioritized Experience Replay》,提出了一种全新的采样机制——优先级经验回放。该方法的核心是:强化学习算法可以从更重要、更有价值的经验中
蓦然回首却已人去楼空7 小时前
人工智能·深度学习
【转载+大量补充】深入理解深度学习中常见激活函数在介绍各种激活函数之前,先了解人工神经网络的提出背景和工作原理,从而更好地理解激活函数的作用,以及各个激活函数的特点分析。(想直接看激活函数的朋友可以跳过这部分直接到第3部分对常用激活函数的介绍。)
冷小鱼8 小时前
人工智能·pytorch·深度学习
PyTorch 2.12 完全指南:从动态图到编译优化的深度学习框架演进PyTorch是一个开源的深度学习框架,由Meta(原Facebook)于2017年1月开源,2022年9月移交至Linux基金会旗下的PyTorch Foundation独立治理。其核心理念是 “定义即运行”(Define-by-Run) ——代码逐行执行,立即返回结果,完全像标准Python一样工作。这与早期TensorFlow的静态图模式形成鲜明对比,也是PyTorch在学术界迅速崛起的关键原因。
YOLO数据集集合8 小时前
人工智能·深度学习·目标检测·计算机视觉·无人机
无人机风电设备智能巡检 风机叶片缺陷目标检测数据集实战 | 表面腐蚀漏油识别 工业视觉质检 深度学习模型训练落地10337期#无人机风电巡检 #风机叶片缺陷检测 #目标检测实战 #工业视觉质检 #深度学习数据集 #风电设备运维 #表面缺陷识别 #漏油腐蚀检测 #AI电力巡检 #边缘部署算法
装不满的克莱因瓶8 小时前
人工智能·python·深度学习·机器学习·计算机视觉·目标跟踪·工业领域
【工业领域】了解目标检测基本流程——从数据到部署的完整工程化思路目录一、前言二、目标检测的本质是什么(一)任务定义(二)输出内容(三)核心区别三、工业目标检测整体流程
装不满的克莱因瓶8 小时前
人工智能·pytorch·python·深度学习·目标检测·计算机视觉·目标跟踪
【工业领域】了解目标检测评估指标——从mAP到IoU的完整评价体系解析目录一、前言二、为什么目标检测不能只看Accuracy(一)分类任务 vs 检测任务分类任务目标检测任务