深度学习

盼小辉丶1 小时前
深度学习·transformer·可解释人工智能
Transformer实战(31)——解释Transformer模型决策随着大语言模型 (Large Language Model, LLM) 的广泛应用,模型输出的准确性与可解释性之间的权衡问题变得尤为重要。可解释人工智能 (explainable artificial intelligence, XAI) 研究中的最大挑战是处理深度神经网络模型中大量的网络层和参数,旨在找到一种方法来理解深度模型如何做出决策。本节将从 Transformer 模型的角度来探讨可解释人工智能,我们已经学习了如何使用多种自注意力机制可视化工具,理解 Transformer 模型如何处理输入,并
渡我白衣2 小时前
人工智能·深度学习·神经网络·目标检测·microsoft·机器学习·自然语言处理
AI应用层革命(七)——智能体的终极形态:认知循环体的诞生本文为《AI应用层革命》系列第七篇,承接前六篇对智能体自主演化、伦理边界与法律框架的系统性探讨。本篇将深入剖析智能体发展的终极方向——认知循环体(Cognitive Loop Entity)。我们将从信息处理、意义生成、自我建模与环境交互四个维度,揭示一种新型智能存在如何突破“工具”与“代理”的局限,成为具备内生目的性、持续反思能力与跨模态整合机制的闭环认知系统。
workflower7 小时前
开发语言·人工智能·python·深度学习·机器学习·结对编程
时序数据获取事件通过时间序列数据“获取事件”,本质上是从连续的时序数据中检测、识别和提取出具有特殊意义或显著变化的离散时间点或时间段。这通常被称为 “事件检测” 或 “变化点检测”。
java1234_小锋9 小时前
深度学习·语言模型·transformer
Transformer 大语言模型(LLM)基石 - Transformer架构详解 - 编码器(Encoder)详解以及算法实现锋哥原创的Transformer 大语言模型(LLM)基石视频教程:https://www.bilibili.com/video/BV1X92pBqEhV
yzx9910139 小时前
人工智能·深度学习
深度学习的进化之路:从感知机到通用智能的曙光2016年3月,AlphaGo以4:1战胜围棋世界冠军李世石,这场历史性的对决不仅震惊了围棋界,更向世界宣告了一个新时代的到来——机器不仅能够执行指令,还能通过“学习”掌握人类数千年来积累的复杂智慧。这一突破的背后,正是深度学习技术的巨大飞跃。
老马啸西风10 小时前
人工智能·深度学习·算法·职场和发展
成熟企业级技术平台-10-跳板机 / 堡垒机(Bastion Host)详解UMS 平台PASSPORT 平台SSO 平台PERMISSION 平台应用管理审计中心IGA(Identity Governance & Administration,身份治理与管理)平台
老马啸西风10 小时前
人工智能·深度学习·算法·职场和发展
成熟企业级技术平台-09-加密机 / 密钥管理服务 KMSS(Key Management & Security Service)UMS 平台PASSPORT 平台SSO 平台PERMISSION 平台应用管理审计中心IGA(Identity Governance & Administration,身份治理与管理)平台
XiaoMu_00112 小时前
人工智能·深度学习
基于深度学习的农作物叶片病害智能识别与防治系统随着精准农业的发展,农作物病害的快速、准确识别对于保障粮食安全和提高农业经济效益至关重要。本文设计并实现了一套基于 YOLOv8 深度学习模型与现代 Web 技术的农作物叶片病害智能识别系统。该系统采用前后端分离架构,前端基于 Vue 3 和 Element Plus 构建,后端采用 Django 框架,集成了经过微调的 YOLOv8 目标检测算法。实验结果表明,该模型在 PlantVillage 数据集上取得了优异的识别精度,平均精度均值 (mAP) 表现显著。系统不仅实现了病害的实时识别,还结合专家知
Coding茶水间13 小时前
人工智能·深度学习·yolo·目标检测·机器学习·计算机视觉
基于深度学习的脑肿瘤检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)基于深度学习的脑肿瘤检测系统演示脑肿瘤作为一种常见的神经系统疾病,其早期精准识别对临床诊疗方案的制定及预后评估具有重要意义。近年来,计算机断层扫描(CT)、磁共振成像(MRI)等医学影像技术为脑肿瘤的诊断提供了重要依据,但传统影像分析高度依赖医师经验,存在诊断周期长、主观差异大等问题。随着人工智能与医学影像分析的深度融合,基于深度学习的目标检测技术为脑肿瘤的自动化检测提供了新的技术路径。
L.EscaRC13 小时前
人工智能·rnn·深度学习
【AI基础篇】认识RNNRNN 的核心设计目标是让神经网络能够处理序列数据——即前后输入有依赖关系的数据,如句子(单词序列)、股票价格(时间序列)、视频(帧序列)等。
Buxxxxxx15 小时前
深度学习·神经网络·机器学习
DAY 38 MLP神经网络的训练@浙大疏锦行
deephub16 小时前
人工智能·python·深度学习·大语言模型
DeepSeek-R1 与 OpenAI o3 的启示:Test-Time Compute 技术不再迷信参数堆叠过去2年,整个行业仿佛陷入了一场参数竞赛,每一次模型发布的叙事如出一辙:“我们堆了更多 GPU,用了更多数据,现在的模型是 1750 亿参数,而不是之前的 1000 亿。”
一瞬祈望17 小时前
人工智能·深度学习
⭐ 深度学习入门体系(第 3 篇):反向传播到底怎么工作的?反向传播(Backpropagation)是深度学习里最“常见但最难讲清”的知识点。很多人学完的感觉是:
Felaim17 小时前
人工智能·深度学习·自动驾驶
Sparse4D 时序输入和 Feature Queue 详解Sparse V3论文:https://arxiv.org/pdf/2311.11722 源码地址:https://github.com/linxuewu/Sparse4D
老马啸西风17 小时前
人工智能·深度学习·算法·职场和发展
成熟企业级技术平台 MVE-010-IGA(Identity Governance & Administration,身份治理与管理)平台UMS 平台PASSPORT 平台SSO 平台PERMISSION 平台应用管理审计中心IGA(Identity Governance & Administration,身份治理与管理)平台
老马啸西风18 小时前
人工智能·深度学习·算法·职场和发展
成熟企业级技术平台 MVE-010-app 管理平台UMS 平台PASSPORT 平台SSO 平台PERMISSION 平台应用管理审计中心IGA(Identity Governance & Administration,身份治理与管理)平台
硅谷秋水18 小时前
人工智能·深度学习·机器学习·语言模型
LLM的测试-时规模化:基于子问题结构视角的综述25年来自Penn State和南洋理工(新加坡)的论文“Test-time Scaling of LLMs: A Survey from A Subproblem Structure Perspective”。
Boxsc_midnight18 小时前
人工智能·python·深度学习·软件工程·设计规范
【规范驱动的开发方式】之【spec-kit】 的安装入门指南在 官网下载 python的最新版本,安装推荐的方式完成。当前python --version输出 3.10.11,说明PATH中存在 Python 3.10 的路径,且优先级高于 3.14。你只需找到PATH中 3.10 的路径,将 3.14 的路径移到它前面,就能让python默认指向 3.14.2。 具体操作步骤(Windows PowerShell)
阿正的梦工坊19 小时前
人工智能·深度学习·语言模型
RLVE:通过自适应可验证环境扩展语言模型的强化学习这篇论文《RLVE: Scaling Up Reinforcement Learning for Language Models with Adaptive Verifiable Environments》提出了一种创新的RL框架,针对语言模型(LM)强化学习中数据饱和和难度不匹配的痛点。传统RL训练依赖静态数据集,导致简单问题无学习信号、难题奖励稀疏,训练易卡住。论文的创新在于引入自适应可验证环境(Adaptive Verifiable Environments),这些环境能无限生成问题,并动态调整难度
nwsuaf_huasir20 小时前
pytorch·深度学习·学习
深度学习2-pyTorch学习-张量基本操作如果A是一个矩阵,在matlab中我们取出来A矩阵的第m行n列的元素,可以用A(m,n)。取出来第i行的元素可以用A(i,:),取出来第i列的元素,可以用A(:,i)。而对于pytorch中的张量,它的索引略有不同: