技术栈
深度神经网络
懒惰才能让科技进步
1 个月前
人工智能
·
gpt
·
深度学习
·
语言模型
·
chatgpt
·
transformer
·
深度神经网络
从零学习大模型(二)-----AG_NEWS上训练自回归Transformer
有兴趣的同学可以在自己的电脑上跑跑看看实验结果
叶庭云
4 个月前
pytorch
·
深度神经网络
·
dropout
·
model.eval
·
评估模式
分析为什么在 PyTorch 中,训练好深度神经网络后要使用 model.eval()
🍉 CSDN 叶庭云:https://yetingyun.blog.csdn.net/训练模式 VS 评估模式。首先,我们需要明确 PyTorch 中的模型存在两种重要模式:训练模式(training mode)与评估模式(evaluation mode)。通过调用 model.eval() 方法,我们可以轻松地将模型切换到评估模式。
算力资源比较多
4 个月前
人工智能
·
深度学习
·
机器学习
·
深度神经网络
大模型深度神经网络(Deep Neural Network, DNN)
大模型深度神经网络(Deep Neural Network, DNN)是一种复杂的机器学习模型,其特点在于包含多个隐藏层,从而赋予模型强大的非线性表达能力和对复杂数据模式的学习能力。以下是对大模型DNN的详细介绍:
叶庭云
7 个月前
激活函数
·
反向传播
·
深度神经网络
·
梯度消失
·
梯度爆炸
训练深度神经网络,使用反向传播算法,产生梯度消失和梯度爆炸问题的原因?
🍉 CSDN 叶庭云:https://yetingyun.blog.csdn.net/反向传播是神经网络训练的精髓。它是根据上一个迭代获得的误差(即损失)对神经网络的权重进行微调的做法。权重的适当调整可确保较低的误差,从而通过提高模型的泛化能力使其变得可靠。反向传播算法的核心思想和工作原理可分为以下几个方面:
好知识传播者
7 个月前
python
·
机器学习
·
深度神经网络
Python机器学习项目开发实战:深度神经网络
注意:本文的下载教程,与以下文章的思路有相同点,也有不同点,最终目标只是让读者从多维度去熟练掌握本知识点。
Hard Coder
9 个月前
论文阅读
·
图像处理
·
隐写术
·
深度神经网络
·
隐写网络
·
模型伪装
图像处理之《隐写网络的隐写术》论文阅读
一、文章摘要隐写术是一种在双方之间进行秘密通信的技术。随着深度神经网络(DNN)的快速发展,近年来越来越多的隐写网络被提出,并显示出良好的性能。与传统的手工隐写工具不同,隐写网络的规模相对较大。如何在公共信道上秘密传输隐写网络引起了人们的关注,这是隐写技术在实际应用中的关键阶段。为了解决这一问题,本文提出了一种新的隐写网络隐写方案。不像现有的隐写方案,其重点是微妙的修改封面数据,以适应秘密。我们建议将隐写网络(称为秘密DNN模型)伪装成执行普通机器学习任务(称为隐写任务)的隐写DNN模型。在模型伪装过程中
hiddenSharp429
1 年前
人工智能
·
python
·
机器学习
·
pandas
·
深度神经网络
【Python】人工智能-机器学习——不调库手撕深度网络分类问题
在不调用机器学习库的情况下,使用神经网络模型来预测一个花所属的种类。该作业已经全部完成,没有未完成的部分。全部代码我已经放在GitHub上和colab上了,可以点击下面的链接进行跳转。