我觉得万事万物都逃不过y=f(x)这个关系,输入在某种法则作用下变成了输出,这个用来理解宇宙,就是我们知道宇宙的现状,就是y,知道自然法则,就是f,我们不知道的是x,其实深度学习也是如此,模型要找的是f,通过不断减小预测和真实值的 损失来找最好的w和b,而这个就是f,最好的f应该是方之四海而皆准的,而且深度学习中很多都是分类问题,图像分类,文本分类是分类,图像分割也可以看成分类,是对像素的分类,还有翻译,就是预测下一个字的概率分布,也是分类,看这个词元属于词汇表中的哪一个,图片可以看成序列,因为它是由像素值有序排成的,文本就是序列,所谓词嵌入就是为单个词元用数学向量表示,这样可以把这些问题归结为一个东西y=f(x),输入都是实际事物的抽象,是实际事物的数字表示,已知的是输入和结果,要找的是f,我们用损失来引导模型学习,模型在减小损失的过程中,逐渐接近本质,我之所以说翻译是分类,是因为模型要预测的是当前词元是词汇表中的那个词,就是一个词汇表大小的分类,最重要的是建摸,抽象出有用的数据
相关推荐
东锋1.32 小时前
深度解析近期爆火的 DeepSeek爱研究的小牛2 小时前
讯飞智作 AI 配音技术浅析(二):深度学习与神经网络灵封~3 小时前
自定义数据集 使用pytorch框架实现逻辑回归并保存模型,然后保存模型后再加载模型进行预测,对预测结果计算精确度和召回率及F1分数新加坡内哥谈技术3 小时前
Deepseek-R1 和 OpenAI o1 这样的推理模型普遍存在“思考不足”的问题終不似少年遊*3 小时前
国产之光DeepSeek架构理解与应用分析AI浩4 小时前
【Block总结】CSAM,包含分割、关键点、切分等均适用!|即插即用oneway_up6 小时前
神经网络参数量和运算量的计算- 基于deepspeed库和thop库函数zxfeng~9 小时前
深度学习之“缺失数据处理”deephub9 小时前
PyTorch生态系统中的连续深度学习:使用Torchdyn实现连续时间神经网络Ronin-Lotus9 小时前
深度学习篇---深度学习框架