深度学习感悟

我觉得万事万物都逃不过y=f(x)这个关系,输入在某种法则作用下变成了输出,这个用来理解宇宙,就是我们知道宇宙的现状,就是y,知道自然法则,就是f,我们不知道的是x,其实深度学习也是如此,模型要找的是f,通过不断减小预测和真实值的 损失来找最好的w和b,而这个就是f,最好的f应该是方之四海而皆准的,而且深度学习中很多都是分类问题,图像分类,文本分类是分类,图像分割也可以看成分类,是对像素的分类,还有翻译,就是预测下一个字的概率分布,也是分类,看这个词元属于词汇表中的哪一个,图片可以看成序列,因为它是由像素值有序排成的,文本就是序列,所谓词嵌入就是为单个词元用数学向量表示,这样可以把这些问题归结为一个东西y=f(x),输入都是实际事物的抽象,是实际事物的数字表示,已知的是输入和结果,要找的是f,我们用损失来引导模型学习,模型在减小损失的过程中,逐渐接近本质,我之所以说翻译是分类,是因为模型要预测的是当前词元是词汇表中的那个词,就是一个词汇表大小的分类,最重要的是建摸,抽象出有用的数据

相关推荐
学术头条24 分钟前
AI 的「phone use」竟是这样练成的,清华、智谱团队发布 AutoGLM 技术报告
人工智能·科技·深度学习·语言模型
孙同学要努力33 分钟前
《深度学习》——深度学习基础知识(全连接神经网络)
人工智能·深度学习·神经网络
喵~来学编程啦1 小时前
【论文精读】LPT: Long-tailed prompt tuning for image classification
人工智能·深度学习·机器学习·计算机视觉·论文笔记
-Nemophilist-3 小时前
机器学习与深度学习-1-线性回归从零开始实现
深度学习·机器学习·线性回归
羊小猪~~7 小时前
神经网络基础--什么是正向传播??什么是方向传播??
人工智能·pytorch·python·深度学习·神经网络·算法·机器学习
软工菜鸡7 小时前
预训练语言模型BERT——PaddleNLP中的预训练模型
大数据·人工智能·深度学习·算法·语言模型·自然语言处理·bert
哔哩哔哩技术8 小时前
B站S赛直播中的关键事件识别与应用
深度学习
deephub9 小时前
Tokenformer:基于参数标记化的高效可扩展Transformer架构
人工智能·python·深度学习·架构·transformer
___Dream9 小时前
【CTFN】基于耦合翻译融合网络的多模态情感分析的层次学习
人工智能·深度学习·机器学习·transformer·人机交互
极客代码9 小时前
【Python TensorFlow】入门到精通
开发语言·人工智能·python·深度学习·tensorflow