深度学习

2301_764441331 小时前
人工智能·深度学习·机器学习
年龄预测识别模型训练python代码涵盖断点续训、早停机制、定期保存检查点等检查点保存逻辑检查点保存分为两种:最新检查点:每次训练都会保存为 latest.pth,用于恢复训练。
James. 常德 student1 小时前
深度学习·线性代数
从深度学习角度看线性代数标量由于没有方向,因此只考虑大小,运算直接加减乘除即可。 矩阵其实是将空间进行了扭曲。了解即可 矩阵相乘公式如下:
阿正的梦工坊1 小时前
深度学习·分类·数据挖掘
Categorical分布(分类分布):深度学习中的离散建模利器对于深度学习研究者来说,概率分布是模型设计和优化的基石。在许多生成模型中,如变分自编码器(VAE)及其变种VQ-VAE(Vector Quantized Variational Autoencoder),我们需要对离散的潜在变量进行建模。这时,Categorical分布(分类分布)就成为一个自然而强大的工具。本文将深入探讨Categorical分布的数学定义、通俗解释,以及它在深度学习中的应用场景,特别是结合VQ-VAE的背景,剖析其为何在此类模型中扮演关键角色。
小白的高手之路1 小时前
人工智能·pytorch·python·深度学习·学习·数据可视化
Pytorch中Tensorboard的学习TensorBoard 是 TensorFlow 开发的一个可视化工具,用于帮助用户理解和调试机器学习模型的训练过程。尽管它最初是为 TensorFlow 设计的,但通过 PyTorch 的 torch.utils.tensorboard 模块,PyTorch 用户也可以方便地使用 TensorBoard 来记录和可视化模型训练中的各种数据(记得先安装tensorboard包,pytorch不自带)。   SummaryWriter 是 PyTorch 中与 TensorBoard 交互的核心类,用于将数
进取星辰2 小时前
人工智能·pytorch·深度学习
PyTorch 深度学习实战(23):多任务强化学习(Multi-Task RL)多任务强化学习(Multi-Task RL)旨在让智能体同时学习多个任务,通过共享知识提升学习效率和泛化能力。与单任务强化学习的区别在于:
阿正的梦工坊3 小时前
人工智能·深度学习·神经网络·transformer
深入剖析ReLU激活函数:特性、优势与梯度消失问题的解决之道,以及Leaky ReLU 和 Parametric ReLU在深度学习领域,激活函数的选择直接影响神经网络的训练效果和性能。整流线性单元(Rectified Linear Unit,简称ReLU)因其简单性、高效性以及对梯度消失问题的缓解能力,成为现代深度神经网络中最常用的激活函数之一。本文将从ReLU的定义、数学特性、梯度行为以及其在深度学习中的应用出发,深入探讨其为何能有效避免梯度消失问题,并提供一些深刻的洞见,面向具有扎实基础的深度学习研究者。
suxuyu015 小时前
pytorch·深度学习·机器学习
torch.nn和torch.nn.function的区别torch.nn一般作为class提供,需要实例化后使用 torch.nn.functional一般作为函数提供,无需实例化可直接使用
大明者省5 小时前
深度学习·架构·分类
注意力机制技术分类与深度学习架构演进注意力机制作为深度学习领域的革命性创新,通过动态权重分配实现了对关键信息的聚焦建模。其技术体系可从计算模式、结构特性、应用场景三个维度进行分类,不同技术路径在算法原理与产业应用中展现出显著差异。
liruiqiang056 小时前
人工智能·深度学习·神经网络·学习·机器学习·cnn
卷积神经网络 - 参数学习本文我们通过两个简化的例子,展示如何从前向传播、损失计算,到反向传播推导梯度,再到参数更新,完整地描述卷积层的参数学习过程。
新加坡内哥谈技术6 小时前
人工智能·深度学习·语言模型·自然语言处理·copilot
Claude“延展思考extended thinking“每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/
楼台的春风7 小时前
图像处理·人工智能·深度学习·opencv·算法·计算机视觉·嵌入式
【Harris角点检测器详解】Harris角点检测器是一种用于在图像中检测角点的算法。角点是图像中亮度变化显著的区域,通常位于物体的边缘交汇处。Harris检测器通过计算图像的梯度和协方差矩阵,检测出这些显著的点。
FL16238631299 小时前
人工智能·深度学习·计算机视觉
医学图像分割数据集肺分割数据labelme格式6299张2类别数据集格式:labelme格式(不包含mask文件,仅仅包含jpg图片和对应的json文件)图像分辨率:1024x1024
仙人掌_lz15 小时前
人工智能·深度学习·ai·pdf·rag
RAG(Retrieval-Augmented Generation)基建之PDF解析的“魔法”与“陷阱”嘿,亲爱的算法工程师们!今天咱们聊一聊PDF解析的那些事儿,简直就像是在玩一场“信息捉迷藏”游戏!PDF文档就像是个调皮的小精灵,表面上看起来规规矩矩,但当你想要从它那里提取信息时,它就开始跟你玩捉迷藏了。 在RAG(Retrieval-Augmented Generation)中,从文档中提取信息是一个不可避免的场景。确保从源内容中有效提取信息对于提高最终输出的质量至关重要。
小白的高手之路16 小时前
开发语言·人工智能·pytorch·python·深度学习·机器学习
Pytorch中的数据加载数据加载之前,先学习两个Pytorch中的类:Dataset和DataLoader。在 PyTorch 中,Dataset 和 DataLoader 是两个非常重要的类,用于高效地加载和处理数据。它们通常一起使用,以便在训练深度学习模型时更好地管理数据。如果数据是图像数据,可以使用Image模块来完成图片操作。除此之外,可能还需要用到Python标准库中的os模块,如文件路径拼接,文件列表。
Fansv58716 小时前
人工智能·pytorch·经验分享·python·深度学习·机器学习
深度学习框架PyTorch——从入门到精通(6.2)自动微分机制本节内容:来自Pytorch官网-Docs - Autograd mechanics 本节将概述自动微分(autograd)的工作原理和记录操作。 理解这一切并不是绝对必要的,但建议熟悉它,因为它将帮助您编写更高效、更干净的程序,还可以在调试程序时帮你理解程序。
墨绿色的摆渡人16 小时前
人工智能·pytorch·python·深度学习·语言模型·embedding
用 pytorch 从零开始创建大语言模型(六):对分类进行微调本章内容包括:到目前为止,我们已经编写了LLM架构,对其进行了预训练,并学习了如何将来自外部来源(如OpenAI)的预训练权重导入我们的模型中。现在我们将开始收获劳动成果,通过在特定目标任务上对LLM进行微调,例如文本分类。本章中我们要研究的具体示例是将短信分类为“垃圾信息”或“非垃圾信息”。图6.1强调了对LLM进行微调的两种主要方式:用于分类的微调(步骤8)和用于指令跟随的微调(步骤9)。
liruiqiang0517 小时前
人工智能·深度学习·神经网络·算法·机器学习·cnn
卷积神经网络 - 梯度和反向传播算法在卷积网络中,参数为卷积核中权重以及偏置。和全连接前馈网络类似,卷积网络也可以通过误差反向传播算法来进行参数学习。本文我们从数学角度,来学习卷积神经网络梯度的推导和其反向传播算法的原理。
odoo中国19 小时前
人工智能·深度学习·正则化
深度学习 Deep Learning 第7章 深度学习的正则化正则化技术是深度学习中防止过拟合、提升模型泛化能力的核心手段。本章深入探讨了深度学习中的正则化技术,旨在解决模型在新数据上的泛化能力问题。正则化是通过在学习算法中引入额外的约束或惩罚项,来减少模型的过拟合现象,从而提高其在未见过的数据上的表现。本章首先介绍了正则化的定义和基本原理,随后详细讨论了多种正则化策略,包括参数范数惩罚、数据增强、噪声注入、早停、参数共享、稀疏表示、集成方法以及Dropout等。此外,还探讨了正则化在解决欠约束问题、提升模型鲁棒性以及优化模型性能方面的重要作用。通过这些内容,读者将
沉默的舞台剧19 小时前
深度学习·决策树·机器学习
【深度学习入门_机器学习理论】梯度提升决策树(GBDT)梯度提升决策树是一种集成技术,通过结合多个基础学习器(通常是决策树)的预测,生成一个强大的模型。与传统的提升方法不同,GBDT通过添加新的树来优化损失函数,这些新的树修正了之前树所犯的错误。这种顺序学习方法使模型能够捕捉到数据中的复杂模式。
cainiao08060520 小时前
pytorch·深度学习·tensorflow
深度学习框架对比评测:TensorFlow、PyTorch、PaddlePaddle与MXNet的技术演进与应用实践本文针对当前主流的四大深度学习框架(TensorFlow 2.15、PyTorch 2.2、PaddlePaddle 2.5、MXNet 1.9),从架构设计、开发效率、训练性能、部署能力及生态系统等维度展开系统性评测。通过图像分类、自然语言处理、强化学习三类典型任务的基准测试,结合工业界与学术界的应用场景差异,揭示各框架的核心竞争力与适用边界。测试表明,PyTorch在科研领域保持领先优势,TensorFlow仍是企业级部署的首选,而PaddlePaddle在国产化替代场景中展现出独特价值。