深度学习

冰西瓜6001 小时前
人工智能·深度学习·transformer
深度学习的数学原理(三十二)—— Transformer全场景掩码机制详解在本专栏的第27篇文章中,我们已经初步介绍了Transformer解码器中的掩码注意力(Masked Attention),核心是通过“未来掩码”保证自回归生成时不会“偷看未来”。但这只是掩码机制的一部分,在完整的Transformer训练与推理流程中,我们需要处理两类更通用的场景:
憨波个1 小时前
人工智能·深度学习·算法·音频·语音识别
【说话人日志】DOVER-Lap:overlap-aware diarization 输出融合算法论文:DOVER-Lap: A Method for Combining Overlap-aware Diarization Outputs 作者:Desh Raj, Leibny Paola Garcia-Perera, Zili Huang, Shinji Watanabe, Daniel Povey, Andreas Stolcke, Sanjeev Khudanpur 时间:2020 arXiv:2011.01997 任务:Speaker Diarization Output Combinatio
娃娃略1 小时前
人工智能·深度学习·机器学习
Frame这一章我们重点讨论:如何从混乱的原子坐标中抽象出标准的局部框架(Local Frames)。在第一章我们提到了 S E ( 3 ) SE(3) SE(3) 不变性。直接回归 N N N 个原子的 ( x , y , z ) (x, y, z) (x,y,z) 坐标会面临两个致命问题:
逻辑驱动的ken2 小时前
java·开发语言·深度学习·面试·职场和发展
Java高频面试考点场景题20问题根源:项目订单列表分页查询时,运营脚本从第一页查询到第 5000 页,原 SQL(SELECT * FROM orders LIMIT 100000,20)未走索引覆盖,每扫一条数据需回表查完整信息,10 万条数据回表 10 万次,打爆磁盘 I/O,数据库 CPU 从 30% 飙至 100%。
2zcode2 小时前
人工智能·深度学习·算法
基于深度学习的口腔疾病图像识别系统(UI界面+改进算法+数据集+训练代码)摘要:口腔疾病是影响人类健康的常见疾病,传统的口腔疾病诊断依赖于专业医生的经验判断,存在效率低、主观性强等问题。随着深度学习技术的快速发展,基于计算机视觉的智能检测方法为口腔疾病的早期筛查和辅助诊断提供了新的解决方案。本文设计并实现了一个基于YOLOv8深度学习算法的口腔疾病智能检测系统,旨在提高口腔疾病检测的准确性和效率
小龙报2 小时前
java·人工智能·python·深度学习·低代码·chatgpt·交互
【Coze-AI智能体平台】低代码省时高效:Coze 应用开发全流程指南🔥小龙报:个人主页 🎬作者简介:C++研发,嵌入式,机器人方向学习者 ❄️个人专栏:《coze智能体开发平台》 ✨ 永远相信美好的事情即将发生
Echo_NGC22372 小时前
人工智能·python·深度学习·神经网络·机器学习·conda·transformer
【论文解读】Attention Is All You Need —— AI 时代的“开山之作“,经典中的经典(transformer小白导读)🏷️ 论文原名:Attention Is All You Need 👥 作者团队:Google Brain (Ashish Vaswani, Noam Shazeer 等) 📅 发表年份:2017 (NIPS) 🌟 地位:这是深度学习历史上最重要的论文之一,它提出的 Transformer 架构开启了如今的大模型时代(GPT, BERT, Claude 等均源于此)。
一切皆是因缘际会2 小时前
大数据·人工智能·深度学习·算法·安全·架构
下一代 AI 架构:基于记忆演化与单向投影的安全智能系统0 前言 当前大模型与 AI 智能体普遍面临四大无法绕过的底层问题:上下文爆炸、长期记忆丢失、人格漂移、安全不可控。传统方案依赖上下文扩展、向量检索、微调与强化学习,只能缓解症状,无法从根源解决。 本文基于记忆演化理论与全息单向投影架构,提出一套全新的 AI 运行范式:记忆分层、权重驱动、虚实隔离、先天规则锁死、后天经验可成长。该架构不依赖量子硬件、不依赖超大模型、可在通用 CPU 上直接运行,从结构层面实现长效记忆、稳定人格、绝对安全、常量算力,是下一代 AI、数字生命、智能体的通用底层基座。 1 现有
2zcode3 小时前
人工智能·深度学习·智能电视
面向健身与康复训练的基于深度学习的人体姿态检测与动作纠正系统摘要:随着健身和康复训练需求的日益增长,传统的人工指导方式存在成本高、效率低、难以实时反馈等问题。为解决这些问题,本文设计并实现了一种面向健身与康复训练的基于深度学习的人体姿态检测与动作纠正系统。
ting94520003 小时前
pytorch·rnn·深度学习
动手学深度学习(PyTorch版)深度详解(8):现代循环神经网络(实战 + 避坑)在第上一章中,我们掌握了基础循环神经网络(RNN) 的核心逻辑,理解了其通过隐状态传递时序信息、处理序列数据的底层原理。但实践中,基础 RNN 存在两大致命缺陷:梯度消失 / 梯度爆炸(长序列中早期信息逐渐丢失)、长期依赖捕捉能力弱(无法关联序列首尾的关键信息)。
葫三生4 小时前
人工智能·深度学习·神经网络·算法·搜索引擎·开源·transformer
三生原理文章被AtomGit‌开源社区收录的意义探析?AI辅助创作:AtomGit‌ 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台,致力于构建一个中立、开放、公益的开发者生态。AtomGit‌ 在中国开源与人工智能融合生态中处于领先地位‌,是推动国产AI基础设施发展的核心平台之一。
DogDaoDao4 小时前
人工智能·深度学习·开源·大模型·github·ai编程·opeclaw
【GitHub】OpenClaw:开源个人AI助手的新标杆OpenClaw(官网:https://openclaw.ai)是一个功能强大的开源个人AI助手项目,其Slogan为"Your own personal AI assistant. Any OS. Any Platform. The lobster way. 🦞"。截至目前,该项目在GitHub上已获得超过 367,000 Stars,成为全球排名第6的热门开源项目,Fork数超过75,000,拥有来自全球2,000多位贡献者的参与。
机器学习之心4 小时前
深度学习·transformer·锂电池剩余寿命预测
信号分解+深度学习+RUL预测!MVMD-Transformer-BiGRU锂电池剩余寿命预测(容量特征提取+剩余寿命预测)代码实现了一个基于多变量变分模态分解(MVMD)和 Transformer-BiGRU 深度网络的电池容量预测框架,主要用于 NASA 锂电池的剩余使用寿命(RUL)估计。
大江东去浪淘尽千古风流人物4 小时前
深度学习
【DROID-W / WildGS-SLAM】动态场景SLAM:不确定性驱动BA、3DGS建图与10个核心优化点深度解析DROID-W(WildGS-SLAM,CVPR 2026,ETH Zurich)在 DROID-SLAM 的密集 BA 框架基础上,引入可学习的逐像素不确定性掩码,并集成 3D Gaussian Splatting(3DGS)建图,专为动态场景设计。其核心突破在于:不确定性不是后处理掩码,而是与位姿、深度共同参与 BA 优化的状态量,仅用 385 个参数即可在线自适应动态场景。本文对 10 个关键工程优化点进行代码级梳理,每个优化点附具体文件路径,并总结对传统 SLAM 的借鉴价值。
淡海水13 小时前
人工智能·深度学习·机器学习
【AI模型】常见问题与解决方案【AI&游戏】专栏-直达本章汇总AI工具使用过程中的常见问题及解决方案。在使用AI模型的过程中,开发者和用户经常会遇到各种技术问题,从模型选择到部署优化,从API调用到成本控制。本指南旨在系统性地解答这些常见问题,帮助读者快速定位和解决问题。由于AI技术发展迅速,部分答案可能需要根据最新情况进行调整,建议读者同时关注各平台的官方文档更新。
β添砖java14 小时前
人工智能·深度学习
深度学习(13)PyTorch神经网络基础① nn.Sequential 定义了一种特殊的Module。👉 意思是:数学上:👉 本质就是:👉 ReLU 规则:
victory043115 小时前
人工智能·深度学习·机器学习
论文设计和撰写1NeurIPS 2026 Evaluations & Datasets Track 官方介绍: https://blog.neurips.cc/2026/03/23/introducing-the-evaluations-datasets-track-at-neurips-2026/
沪漂阿龙17 小时前
人工智能·深度学习
OpenAI Agents SDK 深度解析(三):执行层——Agent 的“幕后指挥部”开发一个智能体,就像训练一名士兵。你给他下达一个任务,他最终会交回一个结果。但是,如果这名士兵在执行任务的途中开了几枪、呼叫了几次炮火支援、又换了几次频道联络后方基地——你却完全不知道。你只知道“任务完成”或者“任务失败”。
数智工坊17 小时前
网络·论文阅读·人工智能·深度学习·transformer
【SAM-DETR论文阅读】:基于语义对齐匹配的DETR极速收敛检测框架DETR 凭借端到端、无Anchor、无NMS封神检测领域,但有个致命痛点: 收敛速度极慢,需要 500 epoch 才能训练好,是 Faster R-CNN 的 10 倍以上。
童园管理札记17 小时前
经验分享·深度学习·职场和发展·微信公众平台
【续】数字时代:学前教育的新改革四、数字时代学前教育的新改革面临问题(一)技术应用浅表化,形式主义突出部分幼儿园存在“重硬件、轻应用”误区,盲目采购高端设备,却仅用于课堂展示、视频播放,未与保教内容深度融合 ;部分教师为完成数字化考核,过度使用数字工具,导致幼儿视觉疲劳、注意力分散,违背儿童发展规律;数字资源与园本课程脱节,引入资源与教学目标冲突,反而增加教师工作负担。