深度学习

chen_zn9520 分钟前
人工智能·深度学习·具身智能·vla
VLA 的 Co-training:通过多源数据提升机器人泛化能力存在问题:机器人数据和互联网视觉语言数据教给模型的东西并不相同。一条常见的机器人轨迹通常包含以下信息:
大模型最新论文速读31 分钟前
论文阅读·人工智能·深度学习·自然语言处理
06-15 · LLM 最新论文速览今日候选池 89 篇,硬过滤 + LLM 打分后通过评估 7 篇。关注方向:多 Agent 系统 / LLM 后训练(RL/SFT) / 扩散语言模型 / 推理加速 / 长上下文 / 量化交易
_codemonster43 分钟前
人工智能·深度学习·机器学习
手语识别损失函数当前手语识别训练用的是多分类交叉熵损失函数:位置在:train_sign.py训练时是这样算的:也就是:
装不满的克莱因瓶1 小时前
人工智能·pytorch·python·深度学习·机器学习·3d·ai
了解3D卷积原理——从空间感知到时空建模的深度学习核心算子目录一、前言二、什么是3D卷积(一)基本定义(二)一句话理解(三)适用数据三、2D卷积 vs 3D卷积
人工智能培训2 小时前
gpt·深度学习·机器学习·容器·知识图谱
数字孪生的未来发展方向探析数字孪生是依托数据建模、实时传感、仿真推演等技术,在数字空间构建物理实体镜像的新型数字化技术,是打通物理世界与数字世界的核心桥梁。历经多年迭代,数字孪生已摆脱单一可视化展示的初级形态,从工业生产、城市治理等试点场景走向规模化落地。随着人工智能、5G、云计算等技术的深度融合,数字孪生正迎来全方位升级,朝着智能化、全域化、体系化、价值化的方向稳步迈进,成为数字经济与实体经济深度融合的核心支撑。
江畔柳前堤2 小时前
开发语言·人工智能·python·深度学习·github·word
github实战指南03-Pull Request 全流程实战本章目标:完整走一遍 PR 的创建、Review、合并全流程,这是企业开发中最高频的操作。PR 不是"请求合并代码",而是一次代码评审的协作过程。
云和数据.ChenGuang3 小时前
人工智能·深度学习·机器学习·数据挖掘
人工智能机器学习的偏置项 剖析英 /ˌɪntəˈsept/ 美 /ˌɪntərˈsept/线性公式: y=w1x1+w2x2+...+by = w_1x_1 + w_2x_2 + ... + by=w1x1+w2x2+...+b
Jump 不二3 小时前
人工智能·深度学习·自然语言处理
从 CV 扩散到 NLP:详解 Google DiffusionGemma 架构、推理机制与优劣最近发现个好玩的大模型 DiffusionGemma-26B-A4B-it,这个模型有什么特别的呢?可以先看下下面这张图。
卡梅德生物科技小能手3 小时前
经验分享·深度学习·生活
卡梅德生物科普CD138(多配体蛋白聚糖-1):细胞微环境的“信号枢纽”与机制解析在细胞生物学与靶向生物研究领域,膜蛋白作为细胞与外界环境交互的关键媒介,一直是科研关注的重点。CD138,学名为多配体蛋白聚糖-1(Syndecan-1),是多配体蛋白聚糖家族中关键的跨膜糖蛋白成员。其凭借在细胞黏附、信号传导及微环境调控中的核心作用,成为解析组织稳态与细胞功能机制的重要靶点。本文将从靶点基础属性、下游作用机制及实验应用趋势三个维度,系统阐述CD138的生物学价值。
zhangfeng11333 小时前
linux·网络·深度学习·c#
国家超算中心 昆山站 异构加速卡1 显存16GB详细配置, 海光 Z100SM HCUrocminfo 输出正常,amdgpu 驱动模块已加载,ROCm HSA 运行时版本 1.1,整机识别到 4 颗 CPU + 4 张 GPU。
大奎帝国4 小时前
深度学习·机器学习·计算机视觉
Segearth-R2-03下面进入 “持续规划 + 源码精读第一阶段”。这次我们做两件事:我建议把整个项目拆成 10 讲,每一讲都有明确目标。
装不满的克莱因瓶4 小时前
人工智能·pytorch·python·深度学习·神经网络·3d·cnn
掌握3D CNN模型结构——从时空特征建模到视频理解与医学影像核心架构目录一、前言二、什么是3D CNN(一)基本定义(二)核心目标(三)一句话理解三、3D CNN输入数据结构
YOLO数据集集合4 小时前
人工智能·深度学习·目标检测·计算机视觉·无人机
无人机航拍RGBT双模态行人检测数据集 | 可见光红外对齐 低空小目标检测 多模态计算机视觉基准数据标签:#无人机视觉 #RGBT多模态检测 #行人小目标识别 #红外可见光融合 #低空安防 #目标检测数据集 #深度学习 #应急搜救 #智慧城市 #跨模态对齐 #航拍感知
古希腊掌管代码的神THU4 小时前
人工智能·深度学习·自然语言处理·面试
解析 MiniMax M3 多模态大模型的架构/源码?📌 本期解析 MiniMax M3 多模态大模型的架构/源码。并且回顾 MiniMax 从 01 到 M3 的发展路线。
动物园猫4 小时前
深度学习·yolo·目标检测
用于实验室智能识别的目标检测数据集分享(适用于YOLO系列深度学习分类检测任务)链接:https://pan.baidu.com/s/1g-Yl6cS59822APpZtuaEaw?pwd=zk43
君为先-bey4 小时前
深度学习·扩散模型·视频生成·潜在扩散模型
LightningDiT----重建与生成:在潜在扩散模型中驯服优化困境论文标题Reconstruction vs. Generation: Taming Optimization Dilemma in Latent Diffusion Models
jay神4 小时前
深度学习·yolo·目标检测·计算机视觉·车牌识别
基于 YOLOv8 + CRNN 的车牌识别系统本项目基于 YOLOv8 + CRNN+CTC 双模型流水线实现车牌检测与字符识别,提供完整的训练流程与可视化桌面应用,支持图片、视频、摄像头多种输入方式的实时检测,并能直接输出车牌号码字符串。
装不满的克莱因瓶4 小时前
人工智能·python·深度学习·yolo·目标检测·计算机视觉·目标跟踪
掌握基于YOLO v5实现车牌目标检测任务的完整流程——从数据到部署的工业级实践目录一、前言二、任务目标拆解(一)任务本质(二)系统目标(三)后续扩展三、整体流程架构四、数据采集(一)数据来源
逻辑君5 小时前
人工智能·深度学习·机器学习
认知神经科学研究报告【20260087】This report analyzes the decision-making log of a DeepSeek-powered AI agent controlling a player character in a custom turn‑based survival game. The log spans approximately 500 turns and contains over 200 AI actions. The agent uses a Chain‑of‑Thought (CoT
大模型最新论文速读5 小时前
论文阅读·人工智能·深度学习·机器学习·自然语言处理
TRUST:RL 时保留模型的不确定性,效果提升 8%一句话介绍强化学习训练智能体的工具决策时,正确和错误决策都被训得同样自信,不确定性的区分能力被"抹平"了。TRUST 把不确定性量化直接写进奖励,当成一股排斥力,推开对错决策,让 4B 模型追平 Claude Sonnet 4